【自然言語処理入門】形態素解析をしてTf-idfとCos類似度で文書類似度を測る

視聴回数 11,967
0
0
自然言語処理は、機械に人間の言葉を理解させる上で非常に重要な領域。

普段使っているGoogle検索やAlexaにも自然言語処理の技術は使われています。

しかし、あんまり自然言語処理の中身についてはブラックボックスでよく分からないですよねー。

なんとなく難しそうな自然言語処理の世界ですが、誰もが簡単に実装できるようになっていますし、どんなものなのか簡単に理解しておくことは非常に重要です。

この動画ではそんな自然言語処理の概要について3つのパートに分けて解説していきます!

・自然言語処理とは
・Mecabで形態素解析
・tf-idfとCos類似度
※この動画は概要編です。プログラミング言語を用いた実装は行わずどのような理屈で自然言語処理が行われているのか簡単な例を用いて解説していきますよ!

■スタビジ
スタビジは「データサイエンスをもっと身近なものに!」をモットーにデータサイエンスの面白さをビジネスを絡ませながら発信しているチャンネルです。
チャンネル登録はこちら↓
http://www.youtube.com/channel/UC0J7Yk_O3g1-x-xD7xxAE8Q?sub_confirmation=1

■サイト(データサイエンスを発信するメディア)※旧:統計ラボ
https://toukei-lab.com/

・PythonのMeCabで形態素解析!Tf-idfとCos類似度で文書の類似度を算出してみよう!
https://toukei-lab.com/python-mecab

・【入門】自然言語処理でできることをいくつかPythonで実装してみる!
https://toukei-lab.com/natural-language-python

・RNN(回帰的ニューラルネットワーク)とは?Pythonでの実装方法と一緒に見ていこう!
https://toukei-lab.com/rnn

・BERTについて解説!日本語モデルを使って予測をしてみようー!
https://toukei-lab.com/bert

■「コスパよくデータサイエンスを学べるスクール」スタビジアカデミー
https://toukei-lab.com/achademy

■Twitterアカウント
ウマたん@スタビジ(https://twitter.com/statistics1012

■私が講師のUdemy講座
以下の記事に私が講師を務めるAIやデータサイエンス関連の講座一覧をまとめています!
https://toukei-lab.com/my-udemy-course
この記事内限定で全ての講座が安くなる講師クーポン(最大94%OFF!)を公開していますのでご受講の際はぜひお使いください!

■出版書籍
・俺たちひよっこデータサイエンティストが世界を変える
https://amzn.to/36XbMFJ
・【入門】Pythonを覚えてエリートリーマンへ!落ちこぼれリーマンの逆転劇:https://amzn.to/31drMyU
・おばあちゃんがWebマーケティングを勉強して雑貨屋をV字回復!
https://amzn.to/3vG3tqC
・漫画で分かるデジタルマーケティング ✕ データ分析
https://amzn.to/44iT84Q
・データサイエンス大全 -シンプルにわかる49の用語と13の実践
https://amzn.to/3mFzhwG