【Python】Google翻訳APIを使って、自動翻訳機能を追加してみた
こんにちは。
前回は以前作成した論文翻訳補助ツールの紹介をしました。
これにより、テキストの修正作業から解放されるのですが、更にこれをGoogle翻訳などの翻訳サイトにコピペしにいく手間がまだあります。
この手間を削減することが本記事の目的になります。
それではさっそくやっていきましょう。
Google翻訳APIを使おう
Googleが無償で提供してくれている、Google TransrationをPythonから呼び出せるAPIが存在します。
それがgoogletransです。これをまずはインストールします。
pip install googletrans==3.1.0a0
このバージョン指定が必要で、私もバージョン指定せずにpip installしたらエラーが発生しました。
以下の記事を参考にしました。
noauto-nolife.com
この記事にもある通り、とても少ない行数で実装することができます。
実装
それでは早速実装していきましょう。
問題は、前回作成したツールのどこに組み込めば良いかを考えます。
main関数を確認します。
大きく2つの機能があることがわかるかと思います。
1.読み込んだテキストの改行等を整形する機能
2.整形した文字列を新しいテキストファイルに出力する機能
整形した文字列に翻訳をかければ良さそうなことがわかります。
というわけで2の出力時に追加します。
実装したコードは以下のGitを参照ください。
github.com
整形した文字列の下の行に翻訳結果を書き込む形で、自動翻訳機能を追加してみました。
実行すると数秒待ちますが、すぐに結果が返ってきます。
Google翻訳のサイトにいちいちコピペしたら数十分~数時間かかることを考えたら、とても効率が良いかと思います。
ちなみに実行結果は以下のようになります。
良い感じに翻訳できてそうですね。
翻訳前と後で見比べることができるので、論文理解に役立つのではないでしょうか?
まとめ
いかがだったでしょうか?
APIを活用することで、より効率化を図れるツールにレベルアップすることができました。
プログラミングもより便利でスマートな活用方法が増えてくると思いますので、あとはそれを上手く使える人になる必要があります。
普段の事務作業を自動化できないかということにアンテナを張りながら、プログラムでどう実装すれば良いかを考える習慣を作ってみてはいかがでしょうか。
参考書籍
統計学をもっとビジネスで活用できるようになりたいなと思い、最近統計学を学びなおしはじめました。
統計学の書籍は混合玉石で、抽象的で難しい本や簡単に説明しすぎて本質がつかみにくい本が多くあるように思います。
その中でも、基本的な概念を把握するのにおススメなのが以下です。
- 価格: 3520 円
- 楽天で詳細を見る
統計学は個人的に極めたいなと思いつつあるので、統計検定も受けようかな。。
資格試験はどうしても点をとるための学習に陥りがちで、取ったところで業務にはあまり役に立たない(時間の無駄)と思い避けてきた傾向があります。
もちろん私はこのブログ同様、使える統計学を前提にした本質理解を重視した学習をします。
データサイエンティストを名乗る以上、ある程度箔というか、実力の裏付けの実績として必要かなぁとか思いはじめました。
先輩データサイエンティストの方がいらっしゃいましたら、統計検定等の資格に関するご意見いただけると幸いです。