自己投資としてチャレンジしている内容を Blog で公開しています。
今回は Python で Word Cloud を実行したいと思います。(In English, Python – WordCloud in Japanese – VS Code on Ubuntu No.90)
Summary
▼1. Word Cloud とは
Word Cloud とは、文字読み込んで、文字の出現頻度もしくは重要度を文字の大きさで視覚的に示す技術です。
今回、 2022 カタールワールドカップの Wiki の文字を Word Cloud で示した例が以下です。2022 FIFAワールドカップ

▼2. 事前準備
2-1. Python の実行環境を構築
Python – Visual Studio Code の利用 No.34
2-2. word cloud のインストール
https://pypi.org/project/wordcloud/
pip install wordcloud
2-3. 日本語フォントのダウンロード
IPAex フォント Ver.004.01 | 一般社団法人 文字情報技術促進協議会 (moji.or.jp)
- IPAex明朝 (Ver.004.01)
ipaexm00401.zip(5.3MB)
unzip ipaexm00401.zip
2-4. Wiki から日本語の文字をファイルにコピー
以下のサイトの文字をコピーし、フォルダ wordcloudtest の配下にある、textjpnv2.txt のファイルにペーストして保存します。
2-5. VS Code の起動
フォルダ wordcloudtest 作成し、Code . を実行すると、この workspace に VS code が開かれます。
mkdir wordcloudtest
cd wordcloudtest
code .
▼3. Python で WordCloud を試す
3-1. WordCloud を実装する Python コードを作成
2 で wordcloudtest フォルダを作成後、フォルダ配下に以下の python のファイル wctest3.py を作成し WordCloud を表示します。2-4 でダウンロードした日本語フォントは font_path に指定します。
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud
x, y = np.ogrid[:300, :300]
mask = (x - 150) ** 2 + (y - 150) ** 2 > 130 ** 2
mask = 255 * mask.astype(int)
with open('textjpnv2.txt', 'r') as f:
text = f.read()
wc=WordCloud(mask=mask,background_color="white",font_path="/home/xxx/wordcloudtest/ipaexm00401/ipaexm.ttf").generate(text)
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()
3-2. 実行結果
実行結果は以下となります。ライヤーンって、なんやーって気になったので調べたら、スタジアムがある地名でした。

▼4. 参考情報
- Get Started Tutorial for Python in Visual Studio Code
- https://pypi.org/project/wordcloud/
- https://amueller.github.io/word_cloud/auto_examples/single_word.html
- IPAフォントのダウンロード方法と使い方 | 趣味や仕事に役立つ初心者DIYプログラミング入門 (resanaplaza.com)
- IPAex フォント Ver.004.01 | 一般社団法人 文字情報技術促進協議会 (moji.or.jp)
以上です。参考になりましたら幸いです。