Новая китайская модель ИИ «лучше лидера отрасли» по ключевым показателям

Китайские ученые утверждают, что создали систему искусственного интеллекта (ИИ), способную превзойти одну из самых распространенных в мире больших языковых моделей (БЯМ).

Spark v3.5 от iFlytek превосходит GPT-4 Turbo от OpenAI в языковых возможностях, математике и кодировании, а также вплотную приближается к американской системе ИИ в некоторых других областях, сообщает китайское государственное СМИ Shine.

Spark v3.5 также незначительно превосходит GPT-4 Turbo в мультимодальных задачах, заявил 29 января на конференции компании глава iFlytek Лю Цинфэн. Это означает, что он лучше понимает один вид входных данных и выдает в качестве ответа другой вид выходных данных — например, принимает текстовый запрос и выдает изображение.

GPT-4 Turbo — это обновленная версия GPT-4, которая используется для работы ChatGPT и считается одним из самых мощных инструментов ИИ с тех пор, как она была выпущена в ноябре 2023 года.

Не существует единого стандартизированного метода сравнения LLM друг с другом, как и общедоступной базы данных, в которой сравнивались бы различные собственные системы ИИ. Скорее, компании используют десятки различных эталонов для получения оценок эффективности в разных областях. ИИ-компании часто используют их для сравнения своих собственных моделей с ведущими в отрасли вариантами.

Например, в декабре 2023 года компания Google показала, что ее новая система Gemini LLM превзошла стандартную версию GPT-4 и другие ведущие модели в 30 из 32 академических эталонов, используемых в исследованиях и разработках ИИ. Среди них были экзамены в средней школе и тесты на знание морали.

По данным государственного телеканала China Global Television Network (CGTN), Spark v.3.5 может синтезировать речь, передающую различные эмоции, тона и речевые обороты. По данным CGTN, его система распознавания речи также превосходит систему Whisper от OpenAI на 37 языках, включая английский, китайский, французский и русский.

По словам Шайна, компания iFlytek интегрировала Spark в смарт-устройства, школьные доски и планшеты. Компания также запустила мобильное приложение «голос в текст» в партнерстве с China Mobile 29 января, которое использует Spark v3.5 для расшифровки телефонных звонков и выделения ключевой информации, переданной в разговоре.

ИИ-инструмент обучался в течение 90 дней на вычислительной платформе под названием «Feixing No. 1». Из-за ограничений на экспорт ИИ китайским компаниям, наложенных правительством США, компания не смогла обучить модель, используя самые современные компоненты. Речь идет о графических процессорах (GPU), созданных компанией Nvidia, включая A100, который использовался для обучения ChatGPT, а также чипы H100 и H200.

Нет комментариев