Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 142 in /var/www/tg-me/post.php on line 75 Библиотека собеса по Data Science | вопросы с собеседований | Telegram Webview: ds_interview_lib/984 -
❓Что делать, если распределение данных меняется со временем? Как это влияет на валидацию и Early Stopping
Когда данные со временем «плывут» (то есть меняется их распределение), фиксированный валидационный набор устаревает. В этом случае Early Stopping может остановить обучение в «лучшей» точке для старого распределения, но не для актуального.
🔍Что можно сделать
1. Обновлять или ротационно менять валидационный набор — Чтобы он отражал текущее состояние данных, а не прошлое.
2. Использовать скользящие метрики или онлайн-мониторинг — Особенно в потоковых системах: метрики качества считаются по «живым» данным, а не по статичному отрезку.
3. Переобучать или дообучать модель при обнаружении дрейфа — Если обнаружили drift, стоит не просто дообучить модель, а пересобрать или адаптировать её с учётом новых данных.
⚠️Подводный камень: Если валидация остаётся неизменной, вы можете не заметить, что модель перестала работать. Early Stopping в этом случае остановит обучение слишком рано или слишком поздно — и модель будет плохо обобщать на реальные данные.
❓Что делать, если распределение данных меняется со временем? Как это влияет на валидацию и Early Stopping
Когда данные со временем «плывут» (то есть меняется их распределение), фиксированный валидационный набор устаревает. В этом случае Early Stopping может остановить обучение в «лучшей» точке для старого распределения, но не для актуального.
🔍Что можно сделать
1. Обновлять или ротационно менять валидационный набор — Чтобы он отражал текущее состояние данных, а не прошлое.
2. Использовать скользящие метрики или онлайн-мониторинг — Особенно в потоковых системах: метрики качества считаются по «живым» данным, а не по статичному отрезку.
3. Переобучать или дообучать модель при обнаружении дрейфа — Если обнаружили drift, стоит не просто дообучить модель, а пересобрать или адаптировать её с учётом новых данных.
⚠️Подводный камень: Если валидация остаётся неизменной, вы можете не заметить, что модель перестала работать. Early Stopping в этом случае остановит обучение слишком рано или слишком поздно — и модель будет плохо обобщать на реальные данные.
At a time when the Indian stock market is peaking and has rallied immensely compared to global markets, there are companies that have not performed in the last 10 years. These are definitely a minor portion of the market considering there are hundreds of stocks that have turned multibagger since 2020. What went wrong with these stocks? Reasons vary from corporate governance, sectoral weakness, company specific and so on. But the more important question is, are these stocks worth buying?
A project of our size needs at least a few hundred million dollars per year to keep going,” Mr. Durov wrote in his public channel on Telegram late last year. “While doing that, we will remain independent and stay true to our values, redefining how a tech company should operate.
Библиотека собеса по Data Science | вопросы с собеседований from us