OpenAI o3‑Mini – это трансформерная модель ИИ от OpenAI, недавно добавленная в GPTunneL. Она ориентирована на задачи STEM, такие как программирование, математика и научные исследования. Разработанная как преемник модели o1‑Mini, o3‑Mini сочетает в себе высокую скорость, улучшенную точность и расширенные возможности, включая поддержку вызова функций и структурированные выходные данные.. 

Преимущества модели

Скорость и эффективность:

  • Согласно данным из анонса o3‑Mini на сайте OpenAI, модель отвечает на запросы примерно на 24% быстрее, чем её предшественница o1‑Mini, что делает её особенно привлекательной для задач, где важна минимальная задержка. Вы можете сами сравнить модели в нашей Арене

Подпись: В среднем, o3-mini начинает генерировать ответ на ваш запрос на 2.46 секунды или 24% быстрее, чем o1 Mini (7.7 сек. против 10.16 сек.).

Универсальность и точность:

  • Модель демонстрирует улучшенные результаты на сложных задачах: тестировщики из OpenAI отметили, что количество серьезных ошибок снизилось на 39% по сравнению с o1‑Mini, а ответы o3‑Mini предпочитаются экспертами более чем в 56% случаев.
  • Специализированный режим для STEM-задач позволяет модели решать логические, математические и программные вопросы на высоком уровне. Стоит отметить, что модель способна воспринимать столько же контекста, сколько и ее предшественники – 128К токенов. На практике это означает, что вы можете ей отдавать целые книги на обработку.
  • Разработчики уделили особое внимание процессу рассуждения. Например, при генерации модель дает пользователю знать, через какие этапы она проходила и почему предоставила именно такой ответ. Это было представлено у o1-mini, но в меньшей степени.

Данные из бенчмарков

  1. Математика

Модель o3-mini (medium), доступная в GPTunneL, справляется с 79.6% задач в рамках бенчмарка AIME 2024, цель которого - протестировать возможности искусственного интеллекта при решении сложнейших математических задач. Модель немного уступает полной версии o1, но легко обходит своего предшественника, o1-mini.

  1. Наука

Модель o3-mini (medium) также показывает превосходные результаты в 76.8% в бенчмарке GPQA Diamond, цель которого заключается в проверке способностей искусственного интеллекта при решении академических задач. Для сравнения, o1-mini показывает результат в 60%.

  1. Codeforces

На соревнованиях Codeforces по решению сложнейших задач по программированию, OpenAI o3‑mini (medium) демонстрирует высокие показатели Elo в 2036 очков. Для сравнения, средний рейтинг участников Codeforces составляет около 1500 баллов, а максимальный рейтинг принадлежит пользователю под ником tourist, который достиг рейтинга 3821.

Советы по промптингу

Модель o3‑Mini способна воспринимать большие объёмы контекста, множество фактов и параметров, а также работать с разнообразными техниками промптинга. Её трансформерная архитектура позволяет анализировать и обрабатывать сложные, детализированные запросы, что является одним из ключевых преимуществ современных языковых моделей. Однако краткость и ясность в формулировке запроса остаются важными по нескольким причинам:

  1. Фокусировка внимания:

Хотя o3‑Mini способна учитывать обширный контекст до 128К токенов, лаконичный и чёткий запрос помогает быстрее выявить основную суть задачи. Это снижает риск того, что модель «раскинет» своё внимание на менее значимые детали, и позволяет ей сфокусироваться на решении главной проблемы. 

Рекомендуем постепенно изменять запросы, руководствуясь тем, как модель будет проводить процесс рассуждения.

  1. Снижение вероятности неоднозначностей:

При длинных, перегруженных деталями запросах могут возникнуть двусмысленности, которые затрудняют интерпретацию задачи. Структурированный запрос минимизирует такие риски, способствуя получению более точного и релевантного ответа. Рекомендуем общаться с o3-mini, как и любым человеческим ассистентом - постепенно уточнять детали, четко составлять инструкции, а также делиться своими наблюдениями на тему разговора.

  1. Ускорение обработки:

Ясно сформулированный запрос позволяет модели быстрее «понять», что от неё требуется, что сокращает время генерации ответа. Это особенно важно в сценариях, где критична скорость отклика.

  1. Гибкость в использовании техник промптинга:

o3‑Mini отлично справляется с различными подходами – будь то role prompting, zero-shot, few-shot или даже сложные, многоступенчатые инструкции. При этом, даже если модель способна анализировать длинные тексты, оптимизация запроса за счёт краткости и ясности помогает обеспечить структурированный и целенаправленный результат. Читайте здесь о методах промптинга.

Несмотря на впечатляющую способность o3‑Mini работать со сложными запросами, краткость и ясность остаются важными инструментами для повышения эффективности и точности её работы. Это не ограничивает модель, а наоборот – позволяет ей использовать весь потенциал, быстро и правильно интерпретируя запросы, даже если они содержат множество параметров и деталей.

Ведь зачем создавать модель, которая не способна обрабатывать сложные запросы, если именно эта способность является её ключевым преимуществом? Эффективное взаимодействие с моделью достигается именно тогда, когда даже сложные идеи формулируются кратко и понятно. Ниже, мы предлагаем продвинутые примеры промптов для o3-mini.

Примеры промптов

Программирование

1. Функция сортировки массива методом quicksort

Напиши функцию на Python, которая сортирует массив целых чисел, используя алгоритм quicksort. Функция должна корректно обрабатывать массивы с повторяющимися элементами и возвращать отсортированный массив. Реализация не должна превышать 50 строк кода. В комментариях внутри кода кратко опиши ключевые этапы алгоритма (например, выбор опорного элемента, разбиение массива, рекурсивную сортировку подмассивов).

Комментарий:

Промпт задаёт конкретные требования: функция на Python, ограничение до 50 строк, корректная обработка дубликатов и поясняющие комментарии. Это помогает получить компактное и понятное решение.

2. Оптимизация фрагмента кода

Возьми следующий фрагмент кода на Python и оптимизируй его для снижения количества вычислительных операций, сохранив при этом исходную функциональность. Объясни внесённые изменения и их влияние на производительность. Постарайся, если возможно, уменьшить время выполнения за счёт использования более эффективных алгоритмических решений или встроенных функций Python, а также добавь комментарии, поясняющие каждый этап оптимизации.

Комментарий:

Промпт требует оптимизировать код с сохранением функциональности, объяснив изменения и их влияние на производительность. Чёткие указания способствуют структурированному и эффективному ответу.

Математика/Физика

1. Вычисление предела последовательности

«Определи предел последовательности, заданной выражением, где числитель представляет собой n‑е корень из факториала n, а знаменатель – число n, делённое на экспоненту (e). Используй приближение Стирлинга для факториала. Пошагово опиши, как применяется приближение и почему оно оправдано, а также поясни, к какому значению стремится последовательность при n, стремящемся к бесконечности.»

Комментарий:

Запрос сложен тем, что требует применения асимптотического приближения и подробного объяснения всех этапов вычисления предела, но изложен достаточно ясно, чтобы модель сфокусировалась на ключевых шагах.

2. Вычисление интеграла Гаусса через переход к двойному интегралу

«Докажи, что интеграл от функции exp(–x²) по x от нуля до бесконечности равен половине квадратного корня из числа пи. Используй метод перехода к двойному интегралу и соответствующее изменение переменных. Пошагово опиши все преобразования и объясни, почему такой подход позволяет получить точный результат.»

Комментарий:

Хотя интеграл Гаусса является классической задачей, запрос усложняется требованием подробного описания перехода к двумерному интегралу и изменения переменных, что требует от модели глубокого анализа и чёткого структурирования ответа.

3. Решение системы дифференциальных уравнений методом собственных значений

«Рассмотри систему линейных дифференциальных уравнений: dx/dt = 3x + 4y и dy/dt = –4x + 3y. Найди общее решение системы, используя метод собственных значений и собственных векторов. Подробно опиши процесс составления характеристического уравнения, нахождения собственных значений, вычисления соответствующих собственных векторов и формулирования общего решения, поясняя, как каждая часть метода способствует решению системы.»

Комментарий:

Этот запрос требует комплексного подхода, включающего линейную алгебру и дифференциальные уравнения, при этом изложен достаточно подробно для того, чтобы модель могла дать структурированный и пошаговый ответ.

Научное исследование или анализ данных

1. Анализ статистики роста населения

Проанализируй предоставленные данные о росте населения в крупных российских городах за последние пять лет. Определи основные тренды, сезонные или структурные изменения и возможные факторы, влияющие на динамику роста. На основе анализа составь обоснованный прогноз для следующего года, используя методы временных рядов или регрессионный анализ, и представь результаты в структурированном виде (например, таблицей или графиком). Объясни, почему выбранный метод анализа подходит для этих данных и какие ограничения могут повлиять на точность прогноза.

Комментарий: 

Промпт четко задаёт этапы анализа – выявление трендов, применение временных рядов/регрессии и структурирование результата, что помогает модели сфокусироваться на ключевых элементах и обосновать выбранный метод, учитывая ограничения данных.

2. Написание введения к научной статье

Сформулируй введение для научной статьи, посвященной актуальным достижениям в области искусственного интеллекта за последние два года. Во введении необходимо:

  • Описать динамику развития технологий ИИ за этот период;
  • Выделить ключевые тренды и инновации, такие как появление новых моделей (например, DeepSeek R1, o3‑Mini и другие);
  • Указать на практическое применение этих достижений в разных областях (программирование, медицина, наука и т.д.);
  • Определить основные вызовы и проблемы, с которыми сталкивается отрасль, и пути их решения;
  • Завершить текст обзором структуры статьи, обозначив основные разделы.

Стремись к тому, чтобы текст был логичным, структурированным и побуждал читателя ознакомиться с дальнейшим содержанием статьи.

Комментарий:

Промпт определяет структуру введения: динамика ИИ, ключевые тренды, практическое применение, вызовы и обзор разделов. Это помогает модели создать логичный, структурированный и мотивирующий текст для привлечения внимания читателя.

Заключение

OpenAI o3‑Mini – это значительный шаг вперёд в развитии моделей ИИ. Благодаря улучшенной скорости, повышенной точности и новым функциям, она становится незаменимым инструментом для решения широкого спектра задач, особенно в STEM‑сфере. 

Поделиться Гайдом
Попробовать в GPTunneL