Telegram Group & Telegram Channel
На RusVectōrēs добавлена поддержка контекстуализированных моделей! Теперь вы можете проводить лингвистические и не только эксперименты не только со статическими моделями, но и с моделями ELMo. Также мы надеемся, что новый сервис пригодится в преподавании NLP-дисциплин.

Почему именно ELMo на рекуррентных нейронных сетях? Качество моделей ELMo зачастую наравне с Трансформерами наподобие BERT, однако в то же время они значительно быстрее, а значит, вам будет удобнее ими пользоваться!

Как устроен новый сервис: вы можете ввести фразу или предложение (оптимально от 5 до 15 слов). Для каждого слова из вашего запроса мы генерируем контекстуализированные вектора при помощи модели ruwikiruscorpora_tokens_elmo_1024_2019 (модель на основе данных НКРЯ и русской Википедии). Для каждого полученного вектора мы ищем наиболее похожие слова среди 10 тысяч самых частотных слов в словаре этой же модели. Резонный вопрос: откуда берутся "общие" бесконтекстные вектора слов? Их мы генерируем путём усреднения контекстных векторов каждого вхождения этих слов в обучающем корпусе модели.

В результате вы получаете лексические подстановки - слова, которые можно было подставить на место соответствующего слова в предложении. Подстановки изменяются в зависимости от контекста, в котором находится слово. Это вы можете проверить экспериментально при помощи нашего сервиса!

Слова в запросе и сами подстановки выделены разным цветом в зависимости от их частотности в исходном корпусе, точно так же как и в остальных сервисах RusVectōrēs: красные слова низкочастотные, голубые - со средней частотностью, зелёные - высокочастотные. Также с помощью размера шрифта мы отображаем косинусную близость между вектором слова из запроса и предсказанной подстановкой. Чем меньше шрифт, тем менее модель уверена в этой подстановке.

Небольшое демо-видео, показывающее работу нашего сервиса, можно найти тут (на английском языке).



tg-me.com/rusvectores/67
Create:
Last Update:

На RusVectōrēs добавлена поддержка контекстуализированных моделей! Теперь вы можете проводить лингвистические и не только эксперименты не только со статическими моделями, но и с моделями ELMo. Также мы надеемся, что новый сервис пригодится в преподавании NLP-дисциплин.

Почему именно ELMo на рекуррентных нейронных сетях? Качество моделей ELMo зачастую наравне с Трансформерами наподобие BERT, однако в то же время они значительно быстрее, а значит, вам будет удобнее ими пользоваться!

Как устроен новый сервис: вы можете ввести фразу или предложение (оптимально от 5 до 15 слов). Для каждого слова из вашего запроса мы генерируем контекстуализированные вектора при помощи модели ruwikiruscorpora_tokens_elmo_1024_2019 (модель на основе данных НКРЯ и русской Википедии). Для каждого полученного вектора мы ищем наиболее похожие слова среди 10 тысяч самых частотных слов в словаре этой же модели. Резонный вопрос: откуда берутся "общие" бесконтекстные вектора слов? Их мы генерируем путём усреднения контекстных векторов каждого вхождения этих слов в обучающем корпусе модели.

В результате вы получаете лексические подстановки - слова, которые можно было подставить на место соответствующего слова в предложении. Подстановки изменяются в зависимости от контекста, в котором находится слово. Это вы можете проверить экспериментально при помощи нашего сервиса!

Слова в запросе и сами подстановки выделены разным цветом в зависимости от их частотности в исходном корпусе, точно так же как и в остальных сервисах RusVectōrēs: красные слова низкочастотные, голубые - со средней частотностью, зелёные - высокочастотные. Также с помощью размера шрифта мы отображаем косинусную близость между вектором слова из запроса и предсказанной подстановкой. Чем меньше шрифт, тем менее модель уверена в этой подстановке.

Небольшое демо-видео, показывающее работу нашего сервиса, можно найти тут (на английском языке).

BY RusVectōrēs




Share with your friend now:
tg-me.com/rusvectores/67

View MORE
Open in Telegram


RusVectōrēs Telegram | DID YOU KNOW?

Date: |

How Does Bitcoin Work?

Bitcoin is built on a distributed digital record called a blockchain. As the name implies, blockchain is a linked body of data, made up of units called blocks that contain information about each and every transaction, including date and time, total value, buyer and seller, and a unique identifying code for each exchange. Entries are strung together in chronological order, creating a digital chain of blocks. “Once a block is added to the blockchain, it becomes accessible to anyone who wishes to view it, acting as a public ledger of cryptocurrency transactions,” says Stacey Harris, consultant for Pelicoin, a network of cryptocurrency ATMs. Blockchain is decentralized, which means it’s not controlled by any one organization. “It’s like a Google Doc that anyone can work on,” says Buchi Okoro, CEO and co-founder of African cryptocurrency exchange Quidax. “Nobody owns it, but anyone who has a link can contribute to it. And as different people update it, your copy also gets updated.”

Spiking bond yields driving sharp losses in tech stocks

A spike in interest rates since the start of the year has accelerated a rotation out of high-growth technology stocks and into value stocks poised to benefit from a reopening of the economy. The Nasdaq has fallen more than 10% over the past month as the Dow has soared to record highs, with a spike in the 10-year US Treasury yield acting as the main catalyst. It recently surged to a cycle high of more than 1.60% after starting the year below 1%. But according to Jim Paulsen, the Leuthold Group's chief investment strategist, rising interest rates do not represent a long-term threat to the stock market. Paulsen expects the 10-year yield to cross 2% by the end of the year. A spike in interest rates and its impact on the stock market depends on the economic backdrop, according to Paulsen. Rising interest rates amid a strengthening economy "may prove no challenge at all for stocks," Paulsen said.

RusVectōrēs from nl


Telegram RusVectōrēs
FROM USA