文化人ブログ

文化人になりた~い!

言語処理100本ノック2020をやろうとした

去年やった,言語処理100本ノックが2020年版になっていたのでやってみようとした.

ニューラルネットワーク機械翻訳などに一部内容変更されてます.

nlp100.github.io

去年やらなかった6章からやろうとしたけど問題発生.

学習で使用するデータセット『News Aggregator Data Set』をダウンロードするためにリンクを踏むと,セキュリティの問題があるとのことでページが表示されんかった.

あきらめて7章からやろうとしたが,今度は使用する単語ベクトルデータがバイナリファイルでつまずく.バイナリファイルってどうあつかえばいいんだ?ていうかバイナリファイルであってんのか?jsonじゃないのか?よくわからなかったのでこちらも断念.

 

結局,やろうとしただけでなんもしなかった.うーん.明日再挑戦します.