Crypto Currency Tracker logo Crypto Currency Tracker logo
#
Forklog 2024-08-12 09:02:52

Новые ИИ-модели от Alibaba обошли GPT-4o в математике

Alibaba запустила группу больших языковых моделей (LLM) с упором на математику под названием Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области. Today we release a new model series for math-specific language models, Qwen2-Math, which is based on Qwen2. The flagship model, Qwen2-Math-72B-Instruct, outperforms proprietary models, including GPT-4o and Claude 3.5, in math related downstream tasks!Feel free to check our blog… pic.twitter.com/9P4BiBweFY— Qwen (@Alibaba_Qwen) August 8, 2024 «За последний год мы приложили немало усилий для изучения и расширения возможностей рассуждений больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи», — отметила команда Qwen, входящая в состав подразделения облачных вычислений Alibaba. Модели Qwen2-Math выпущены на базе представленных в июне LLM Qwen2. Утверждается, что флагманская Qwen2-Math-72B-Instruct превзошла американских конкурентов в математике, в том числе GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.  Сравнение Qwen2-Math с другими ИИ-моделями. Данные: Qwen. В начале августа ИИ-подразделение Google DeepMind выпустило экспериментальную версию своей ведущей ИИ-модели Gemini 1.5 Pro, которая привлекла внимание общественности из-за высоких результатов в ходе тестов.  «Мы надеемся, что Qwen2-Math сможет внести свой вклад в научное сообщество, решая сложные математические задачи, которые требуют многоэтапных логических рассуждений», — отметили разработчики.  Согласно предоставленной информации, новые ИИ-модели Alibaba протестированы на математических задачах на английском и китайском языках. Они включали: GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы; OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний; GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире. Сравнение Qwen2-Math с другими ИИ-моделями в разных тестах. Данные: Qwen. По словам команды, новые ИИ-модели имеют некоторые ограничения из-за поддержки только английского языка. В ближайшее время планируется выпуск двуязычных LLM, а позже — многоязычных.  Напомним, в августе стало известно о работе Alibaba над генератором изображений Tora. Ранее техгигант анонсировал выпуск чат-бота с искусственным интеллектом Tongyi Qianwen.

#
阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约