2019-01-01から1年間の記事一覧

英論文書いたときにもらった指摘事項まとめ

僕は英語があまり得意じゃないので、英論文を書いたときのレビューで様々なコメントをいただく。頂いたコメントをその場で理解して反映させることはできるのだが、次に書くときに忘れていて同じ過ちを繰り返すことが多いので、よく使う文法表現の変換などの…

neologdを利用するにあたってのテキストの前処理について

はじめに 最近、sklearnを使ってtf-idfをを計算するというのをしているのですが、この計算の前に日本語のテキストの分かち書きをしないといけません。 しかし、この分かち書きがなかなか上手くいきません。 例えば、「カラーブラック」というテキストがあっ…

sklearnを使ってtf-idfの勉強した

sklearnを使ってtf-idfの勉強をしたのでその内容をまとめておく。 tf-idf tf-idfを説明するために、まずtf(term frequency)とidf(inverse document frequency)について説明します。 tfは文書に単語が出現する頻度のことです。次の式で表されます。 tfはある…

COMPSAC2019で研究発表をしてきた

7/15日から5日間に渡って開催されたCOMPSAC2019@ミルウォーキーで研究発表をしてきました。 この発表は僕にとって最初の国際学会での口頭発表であり、学ぶことも多かったので、参加までやったことや参加しての感想を書き留めておこうと思います。 発表概要 …

Table driven testについて調べた

sql-maskのPRのレビューでgotestsというものを紹介していただき,Table driven testが気になったので調べました.今回は調べた内容をTable driven testでのテストコードの書き方を例とともに書き留めておきたいと思います. また,Table driven testでsqdとs…

Fukuoka.go#13 + Okayama.goでLTをした

Fukuoka.go#13 + Okayama.goでLTをして(もう1ヶ月前),その時の質問や感想をメモしていたので,ブログに書いておきます. 発表内容は以前のエントリに関するものです. 発表資料 作ったソフトウェア github.com いただいた質問・コメント なぜホワイトリス…