Telegram Group & Telegram Channel
У Alibaba пополнение — семейство LLM Qwen3.

Коротко о главном:

✳️Модели в виде Dense представлены в размерах от 0,6B до 32B параметров.

✳️ Есть 2 модели с архитектурой MoE — на 235B (22B активных) и 30B (3B активных) параметров. Участие в вычислениях последующих токенов не всей модели, а только ее части = меньше требований к «железу».

✳️ Поддержка 119 языков и диалектов.

✳️Улучшены результаты на разных бенчмарках, по сравнению с Qwen 2.5 стало больше голов внимания.

✳️ Все модели поддерживают два режима работы — с размышлением (берет время на «подумать» перед ответом на сложный вопрос) и без (отвечает быстро — подходит для легких вопросов).

Тесты:
Наши первые тесты показали, что в генерации на русском языке у моделей Qwen3 много технических огрехов. Например, у Qwen3-8B в 2396 тестовых генерациях мы увидели 2718 случаев некорректного смешения токенов разных языков в одном слове. То есть в среднем в каждой генерации может содержаться 1 или более таких «ляпов».

А вы что думаете о моделях Qwen3?

👍 Хорошие «рабочие лошадки»
🔥 Заявка на лидерство
Please open Telegram to view this post
VIEW IN TELEGRAM



tg-me.com/mtsai/1096
Create:
Last Update:

У Alibaba пополнение — семейство LLM Qwen3.

Коротко о главном:

✳️Модели в виде Dense представлены в размерах от 0,6B до 32B параметров.

✳️ Есть 2 модели с архитектурой MoE — на 235B (22B активных) и 30B (3B активных) параметров. Участие в вычислениях последующих токенов не всей модели, а только ее части = меньше требований к «железу».

✳️ Поддержка 119 языков и диалектов.

✳️Улучшены результаты на разных бенчмарках, по сравнению с Qwen 2.5 стало больше голов внимания.

✳️ Все модели поддерживают два режима работы — с размышлением (берет время на «подумать» перед ответом на сложный вопрос) и без (отвечает быстро — подходит для легких вопросов).

Тесты:
Наши первые тесты показали, что в генерации на русском языке у моделей Qwen3 много технических огрехов. Например, у Qwen3-8B в 2396 тестовых генерациях мы увидели 2718 случаев некорректного смешения токенов разных языков в одном слове. То есть в среднем в каждой генерации может содержаться 1 или более таких «ляпов».

А вы что думаете о моделях Qwen3?

👍 Хорошие «рабочие лошадки»
🔥 Заявка на лидерство

BY MTS AI




Share with your friend now:
tg-me.com/mtsai/1096

View MORE
Open in Telegram


telegram Telegram | DID YOU KNOW?

Date: |

The messaging service and social-media platform owes creditors roughly $700 million by the end of April, according to people briefed on the company’s plans and loan documents viewed by The Wall Street Journal. At the same time, Telegram Group Inc. must cover rising equipment and bandwidth expenses because of its rapid growth, despite going years without attempting to generate revenue.

NEWS: Telegram supports Facetime video calls NOW!

Secure video calling is in high demand. As an alternative to Zoom, many people are using end-to-end encrypted apps such as WhatsApp, FaceTime or Signal to speak to friends and family face-to-face since coronavirus lockdowns started to take place across the world. There’s another option—secure communications app Telegram just added video calling to its feature set, available on both iOS and Android. The new feature is also super secure—like Signal and WhatsApp and unlike Zoom (yet), video calls will be end-to-end encrypted.

telegram from us


Telegram MTS AI
FROM USA