Загрузка страницы

Представление текста в цифровом виде для нейросети | Нейросети для анализа текстов

В видео рассматриваются различные методы токенизации и векторизации текста для представления его в виде, пригодном для обработки нейросетью. Страница курса - https://www.asozykin.ru/courses/nnpython

Нейронные сети могут работать только с числами. Поэтому перед обработкой текста нейронной сетью, его нужно конвертировать в набор чисел. Для этого используется два шага:
1. Токенизация - разделение текста на отдельные части: символы, слова, предложения.
2. Векторизация - представление каждого токена в виде чисел: кода или вектора (one hot encoding или embedding).

Предварительно обученные плотные векторные представления слов:
1. GloVe (Global Vectors) - https://nlp.stanford.edu/projects/glove/
2. Word2Vec, Google - https://code.google.com/archive/p/word2vec/
3. FastText, Facebook - https://fasttext.cc

Плотные векторные представления слов для русского языка:
1. RusVectōrēs – https://rusvectores.org
2. RUSSE (Russian Semantic Evaluation) – https://russe.nlpub.org/downloads/

Tomas Mikolov, Wen-tau Yih, Geoffrey Zweig. Linguistic Regularities in Continuous Space Word Representations - https://www.microsoft.com/en-us/research/publication/linguistic-regularities-in-continuous-space-word-representations/

Как можно поддержать курс:
1. Яндекс Кошелек - https://money.yandex.ru/to/410014298228017
2. PayPal - https://www.paypal.me/asozykin
Заранее спасибо за помощь!

Добавляйтесь в друзья в социальных сетях:
вКонтакте - https://vk.com/avsozykin
Instagram - https://www.instagram.com/sozykin_andr/
Facebook - https://www.facebook.com/asozykin
Twitter - https://twitter.com/AndreySozykin

Мой сайт - https://www.asozykin.ru

Мой канал с краткими и понятными объяснениями сложных тем в ИТ и компьютерных науках - http://www.youtube.com/c/AndreySozykinCS

Видео Представление текста в цифровом виде для нейросети | Нейросети для анализа текстов канала Andrey Sozykin
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
25 августа 2019 г. 11:27:19
00:13:14
Другие видео канала
Представление текста плотным вектором  | Нейросети для анализа текстовПредставление текста плотным вектором | Нейросети для анализа текстовАнализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстовАнализ тональности отзывов на фильмы IMDB | Нейросети для анализа текстовNLP cookbook: анализируем тексты на Python с минимальными знаниями о машинном обученииNLP cookbook: анализируем тексты на Python с минимальными знаниями о машинном обученииWhat is One Hot EncodingWhat is One Hot EncodingПредставление текста вектором One Hot Encoding | Нейросети для анализа текстовПредставление текста вектором One Hot Encoding | Нейросети для анализа текстовСети LSTM и GRU | Нейросети для анализа текстовСети LSTM и GRU | Нейросети для анализа текстов16. Word embeddings: лекция16. Word embeddings: лекцияСтановиться ли программистом в 30, 40 ИЛИ 50?Становиться ли программистом в 30, 40 ИЛИ 50?Сверточные нейронные сети | Глубокие нейронные сети на PythonСверточные нейронные сети | Глубокие нейронные сети на PythonРекуррентные нейросети | Нейросети для анализа текстовРекуррентные нейросети | Нейросети для анализа текстов[DeepLearning | видео 1] Что же такое нейронная сеть?[DeepLearning | видео 1] Что же такое нейронная сеть?Введение | Глубокие нейронные сети на PythonВведение | Глубокие нейронные сети на PythonОбучение нейронных сетей | Глубокие нейронные сети на PythonОбучение нейронных сетей | Глубокие нейронные сети на PythonКлиент-серверная архитектура в картинкахКлиент-серверная архитектура в картинкахТОП 20 типичных ошибок верстальщиков при верстке сайтовТОП 20 типичных ошибок верстальщиков при верстке сайтовМашинное обучение. Лекция 6. КластеризацияМашинное обучение. Лекция 6. КластеризацияНейронные сети для обработки естественного языка | Нейросети для анализа текстовНейронные сети для обработки естественного языка | Нейросети для анализа текстовПрикладное машинное обучение 1. Intro to NLP. Word embeddingsПрикладное машинное обучение 1. Intro to NLP. Word embeddings
Яндекс.Метрика