Warning: file_put_contents(aCache/aDaily/post/spydell_finance/-7099-7100-7029-): Failed to open stream: No space left on device in /var/www/tg-me/post.php on line 50
Spydell_finance | Telegram Webview: spydell_finance/7099 -
Telegram Group & Telegram Channel
Илон Маск запустил в публичный доступ новую LLM - Grok 3

Это событие произошло 18 февраля ранним утром по МСК и это действительно событие, т.к. по предварительным тестам думающая Grok 3 Reasoning Beta достигает феноменальных показателей в бенчмарках, адаптированных под тестирование LLM.

Интегральный показатель производительности ГИИ (включает в себя бенчмарки MMLU-Pro, GPQA Diamond, Humanity's Last Exam, SciCode, AIME, MATH-500 и другие) вывел Grok 3 Reasoning Beta на уверенное 1 место среди публичных моделей с 67 баллами опережая o3-mini с 63 баллами, DeepSeekR1 с 60, но это для размышляющих/думающих моделей.

Результаты получены в агрегации тестов от artificialanalysis.ai, ранжирование у меня вызывает доверие, т.к. совпадает с моим субъективным опытом использования LLM, хотя я не проводил собственного безупречного изолированного сравнения в лабораторных условиях при непротиворечивой методологии анализа.

Обычные (не рассуждающие модели) также выводят в лидеры Grok-3 с 53 баллами, опережая формально лучшую из публичных «обычных» LLM – Gemini 2.0 PRO - 47, следом идет DeepSeek V3 – 46, Qwen 2.5 Max – 45, Claude 3.5 – 44 и крайне устаревшая ChatGPT-4o – 41.

Плотность конкуренции феноменальная, разрывы минимальные, все решает гибкость LLM, глубина настройки и умение решать специфические задачи.

Идеальных LLM не существует, у каждой есть сильные и слабые стороны, поэтому лучше использовать комбинацию LLMs под разные типы задач.

По формальным показателям, Grok-3 это лучшая из существующих LLM в сопоставимой категории, как среди думающих, так и среди «обычных»,
хотя не самая лучшая, т.к более сильная модель – это OpenAI o3, которая в ограниченной версии за 200 баксов в месяц, но ее сложно назвать публичной.

Grok 3 сейчас стоит около 30 баксов в месяц, лично я пока не тестировал. Этих LLM очень много, буквально обмазаться можно нейросетями, но посмотрю, как пойдет и возможно попробую, весьма перспективно смотрится.

Илон Маск начал позже всех, выпуская относительно слабые LLM (в сравнении с конкурентами), но сумел всех обогнать, подчеркивая экстраординарный темп инноваций в этой индустрии.

Grok 3 использует архитектуру Mixture-of-Experts (MoE), что позволяет стратегически активировать подмножества параметров для различных задач, что делает его эффективнее в обработке и анализе данных. Он включает в себя 314 миллиардов параметров, что делает его крупнейшей из доступных моделей, хотя не самую крупную, но качество модели не имеет линейную зависимость от количества параметров, очень много факторов влияет.

Для обучения Grok 3 использовался суперкомпьютер Colossus, оснащенный 200 тысячами графических процессоров Nvidia H100.

В Grok 3 были введены новые функции, такие как режимы Think и Big Brain для сложных задач, а также инструмент DeepSearch для анализа информации из интернета и из социальной сети X. Также были добавлены возможности генерации изображений и голосового режима.

Илон Маск подчеркнул, что Grok 3 ориентирован на "поиск истины", даже если она идет вразрез с политкорректностью, стремясь к политическому нейтралитету. Это конечно забавно звучит для LLM, чисто маркетинговый ход от шутника Маска.

Развертывание функционала будет идти на протяжении 2-3 месяцев.

Интересно, чем ответят конкуренты? Google уже ничем не ответит до середины лета, когда выкатит промежуточную Gemini 2.5, теперь ждем Llama 4, Claude 4 и возможно OpenAI GPT 4.5 Orion.

Конкуренция ошеломляющая. Гонка за лидерство в ИИ с запредельной скоростью по темпам инноваций.

Буквально один месяц и можно оказаться за бортом.



tg-me.com/spydell_finance/7099
Create:
Last Update:

Илон Маск запустил в публичный доступ новую LLM - Grok 3

Это событие произошло 18 февраля ранним утром по МСК и это действительно событие, т.к. по предварительным тестам думающая Grok 3 Reasoning Beta достигает феноменальных показателей в бенчмарках, адаптированных под тестирование LLM.

Интегральный показатель производительности ГИИ (включает в себя бенчмарки MMLU-Pro, GPQA Diamond, Humanity's Last Exam, SciCode, AIME, MATH-500 и другие) вывел Grok 3 Reasoning Beta на уверенное 1 место среди публичных моделей с 67 баллами опережая o3-mini с 63 баллами, DeepSeekR1 с 60, но это для размышляющих/думающих моделей.

Результаты получены в агрегации тестов от artificialanalysis.ai, ранжирование у меня вызывает доверие, т.к. совпадает с моим субъективным опытом использования LLM, хотя я не проводил собственного безупречного изолированного сравнения в лабораторных условиях при непротиворечивой методологии анализа.

Обычные (не рассуждающие модели) также выводят в лидеры Grok-3 с 53 баллами, опережая формально лучшую из публичных «обычных» LLM – Gemini 2.0 PRO - 47, следом идет DeepSeek V3 – 46, Qwen 2.5 Max – 45, Claude 3.5 – 44 и крайне устаревшая ChatGPT-4o – 41.

Плотность конкуренции феноменальная, разрывы минимальные, все решает гибкость LLM, глубина настройки и умение решать специфические задачи.

Идеальных LLM не существует, у каждой есть сильные и слабые стороны, поэтому лучше использовать комбинацию LLMs под разные типы задач.

По формальным показателям, Grok-3 это лучшая из существующих LLM в сопоставимой категории, как среди думающих, так и среди «обычных»,
хотя не самая лучшая, т.к более сильная модель – это OpenAI o3, которая в ограниченной версии за 200 баксов в месяц, но ее сложно назвать публичной.

Grok 3 сейчас стоит около 30 баксов в месяц, лично я пока не тестировал. Этих LLM очень много, буквально обмазаться можно нейросетями, но посмотрю, как пойдет и возможно попробую, весьма перспективно смотрится.

Илон Маск начал позже всех, выпуская относительно слабые LLM (в сравнении с конкурентами), но сумел всех обогнать, подчеркивая экстраординарный темп инноваций в этой индустрии.

Grok 3 использует архитектуру Mixture-of-Experts (MoE), что позволяет стратегически активировать подмножества параметров для различных задач, что делает его эффективнее в обработке и анализе данных. Он включает в себя 314 миллиардов параметров, что делает его крупнейшей из доступных моделей, хотя не самую крупную, но качество модели не имеет линейную зависимость от количества параметров, очень много факторов влияет.

Для обучения Grok 3 использовался суперкомпьютер Colossus, оснащенный 200 тысячами графических процессоров Nvidia H100.

В Grok 3 были введены новые функции, такие как режимы Think и Big Brain для сложных задач, а также инструмент DeepSearch для анализа информации из интернета и из социальной сети X. Также были добавлены возможности генерации изображений и голосового режима.

Илон Маск подчеркнул, что Grok 3 ориентирован на "поиск истины", даже если она идет вразрез с политкорректностью, стремясь к политическому нейтралитету. Это конечно забавно звучит для LLM, чисто маркетинговый ход от шутника Маска.

Развертывание функционала будет идти на протяжении 2-3 месяцев.

Интересно, чем ответят конкуренты? Google уже ничем не ответит до середины лета, когда выкатит промежуточную Gemini 2.5, теперь ждем Llama 4, Claude 4 и возможно OpenAI GPT 4.5 Orion.

Конкуренция ошеломляющая. Гонка за лидерство в ИИ с запредельной скоростью по темпам инноваций.

Буквально один месяц и можно оказаться за бортом.

BY Spydell_finance





Share with your friend now:
tg-me.com/spydell_finance/7099

View MORE
Open in Telegram


Spydell_finance Telegram | DID YOU KNOW?

Date: |

What is Telegram Possible Future Strategies?

Cryptoassets enthusiasts use this application for their trade activities, and they may make donations for this cause.If somehow Telegram do run out of money to sustain themselves they will probably introduce some features that will not hinder the rudimentary principle of Telegram but provide users with enhanced and enriched experience. This could be similar to features where characters can be customized in a game which directly do not affect the in-game strategies but add to the experience.

What Is Bitcoin?

Bitcoin is a decentralized digital currency that you can buy, sell and exchange directly, without an intermediary like a bank. Bitcoin’s creator, Satoshi Nakamoto, originally described the need for “an electronic payment system based on cryptographic proof instead of trust.” Each and every Bitcoin transaction that’s ever been made exists on a public ledger accessible to everyone, making transactions hard to reverse and difficult to fake. That’s by design: Core to their decentralized nature, Bitcoins aren’t backed by the government or any issuing institution, and there’s nothing to guarantee their value besides the proof baked in the heart of the system. “The reason why it’s worth money is simply because we, as people, decided it has value—same as gold,” says Anton Mozgovoy, co-founder & CEO of digital financial service company Holyheld.

Spydell_finance from cn


Telegram Spydell_finance
FROM USA