Новый ИИ превзошел ChatGPT и Microsoft AI: как он работает и что в нем особенного
Чат-бот MathGPT оказался настоящим экспертом в математике, решив 12,5 тыс. сложных задач.
Компания Qanda заявила, что ее большая языковая модель (БЯМ) под названием MathGPT установила новый мировой рекорд, обойдя чат-ботов от OpenAI и Microsoft, передает Interesting engineering.
ИИ чат-бот MathGPT занял первое место в тестах, оценивающих математические способности, таких как MATH (12 500 сложных математических задач) и GSM8K (8 500 математических задач для начальной школы). Бот Microsoft ToRA 13B, который ранее занимал первую позицию, теперь оттеснен на вторую. Кроме того, нейросеть в данном тесте превзошла GPT-4 от OpenAI.
Разработкой БЯМ занимались также эксперты из компании Upstage. Она обучалась на основе 10 млн задач и, можно сказать, что эта нейросеть — специалист в сфере математики, в отличие от чат-бота ChatGPT, который обучался на текстовых данных. В итоге, ChatGPT получал информацию из разных сфер знаний и понемногу, а MathGPT — только из области математики. Авторы материала указывают, что метод обучения ИИ, к которому прибегли в OpenAI, вызывает у нейросети "феномен галлюцинаций", при котором ложная информация может выдаваться за истинную.
"Это представляет собой серьезную проблему. Особенно в сфере образования, где распространение точной и достоверной информации имеет первостепенное значение. Примечательно, что ChatGPT продемонстрировал низкую точность, особенно в математических областях", — говорится в материале.
"В будущем наш чат-бот сможет служить в качестве репетитора. Такое решение мы предложим образовательным онлайн-платформам", — подчеркнули в Qanda.
Платформу Qanda поддерживают Google, TikTok и Softbank Ventures Asia. Приложение распознает текст и математические уравнения по фотографиям. Ежедневно на Qanda загружают около 10 миллионов фотографий.
Ранее мы сообщали о том, что суперкомпьютер создал ИИ с 1 трлн параметров, задействовав всего лишь 3000 процессоров. Для обучения такого большого ИИ-бота необходим огромный объем памяти — минимум 14 Тб.