新エンジン搭載「ATOK 2017」発表 ディープラーニングで誤変換が30%減 Android版へも順次搭載

一太郎やATOKなどでおなじみのジャストシステムは、定番の日本語入力システム「ATOK」の次期バージョン「ATOK 2017 for Windows」を12月1日に発表しました。

「ATOK 2017」の主な変更点は、10年ぶりに日本語変換エンジンを刷新したこと。快適な日本語入力・変換を実現する、定評のある日本語入力システムATOK。35年の集大成とも言える新しい変換エンジンを搭載しました。

僕はWindows版ではなく、スマホ版の富士通モデル「Super ATOK ULTIAS」を現在利用してますが、本当に変換に関しては賢く、そして入力しやすくてお気に入りです。

というわけでATOK 2017の進化について見ていきましょう!

「深層学習」で誤変換を削減

engine03

新しい変換エンジン「ATOKディープコアエンジン」では、これまでの伝統的な変換アルゴリズムに、ディープラーニング(深層学習)を利用して抽出した日本語の特徴が取り込まれました。

ATOK 2017では、従来の変換アルゴリズム「ATOKハイブリッドコア」が選択した候補と、新しい変換アルゴリズムが選択した候補を比較し、より自然な変換候補を提示できるということです。また、これまで学習機能で蓄積した情報が思い通りの変換を妨げていた現象が解消され、誤変換が30%削減されているといいます。

これまで文節区切りや同音語の第一候補として適切に提示できていた賢さを活かしつつ、不自然であった変換を自然な日本語に変換するようチューニング。

 

具体的な例としては…

%e5%9b%b31

ATOK 2016で「さいしんもでるもでる」を変換しようとすると「最新モデルモデル」になっていました。名詞の後ろに名詞が続くのは不自然ではないですが、2つ続くのは不自然であるため、ATOK 2017では「最新/モデルも/出る」と言ったように正しく変換できます。

同音語選択についても、例えば「けいたいつうしんりょう7ぎが」の場合、従来は「携帯通信料7ギガ」となっていましたが、料金の単位はギガではないことを認識し、ATOK 2017では「携帯通信量7ギガ」に正しく変換できます。

さらに、「三都市」という単語を学習した後、「さとうさんとしのださん」と入力した場合、従来は「佐藤/三都市の/打算」と学習結果を間違って使ってしまっていましたが、ATOK 2017では学習した後でも自然な日本語になるように配慮し、「佐藤/さんと/篠田/さん」のように正しく変換してくれます。

engine02

このほか、「へんしん」という言葉に対してインターネットで調べると「変身」の方が多くヒットしますが、ATOK 2017ではあえて日常で使うことが多い「返信」を変換後方の冒頭に持ってくるなどの配慮を行なっているということです。

日本語入力オフで日本語を英字として入力してしまっても、ATOKがそれを日本語だと認識した場合、ガイダンスを提示し、Shift+変換キーで日本語変換できる状態に戻せる機能も搭載しました。

辞書も操作も見直し

6102ydmbsfl

さらに、ATOK 2017では、機能自体を知らなくても便利な機能を使いこなせるように操作方法が見直されました。例えば、日本語入力がOFFの状態で日本語を入力した場合、入力されたローマ字から日本語を入力したかったことを判別し、ガイダンスで再変換の操作方法を通知するようになりました。

そのほか変換辞書の語彙が拡充され、時事用語に加えて珍しい犬・猫などの品種名や、外国人名、海外地名が増強されました。

ちなみに、現在も映画の名前やお店の名前、有名人の名前なんかもすぐに候補に表示されてますね。例えば「ふぁんた」と打てば一発で「ファンタスティック・ビーストと魔法使いの旅」と表示されます。

もちろんAndroid版にも搭載予定

 

発売予定日は2017年2月3日で、一通りの機能を備えた「ATOK 2017 for Windows [ベーシック]」は通常版が8,000円(税抜)、“岩波国語辞典”などの連携電子辞典を搭載するなど機能を追加した「ATOK 2017 for Windows [プレミアム]」は通常版が12,000円(税別)で販売される予定。現在、予約が受け付けられています。

books

上位のATOK 2017[プレミアム]では、「岩波国語辞典 for ATOK」、「明鏡ことわざ成句使い方辞典 for ATOK」、「大修館四字熟語辞典 for ATOK」、「ジーニアス英和/和英辞典」を収録。岩波国語辞典では、関連語へのリンクを充実させ、新しい言葉との出会いの機会を増やし、明鏡ことわざ成句使い方辞典は、誤用表現から適切な表現を探す際に使えるとしています。国語辞典や英和/和英辞書などが付属するプレミアム版が12,000円、プレミアム版に広辞苑と角川類語新辞典、ロングマン英英/英和辞典を追加したオールインパックが18,000円。

なお、サブスクリプションモデルの「ATOK Passport」は、これまでWindows版とMac版のみが学習データのクラウドアップロードが可能で、Android版はダウンロードのみでしたが、今後Android版もアップロードに対応させる予定だとしています。現時点では詳細は未定で、決まり次第改めて正式発表を行なう予定です。

ディープラーニングを駆使した変換は現時点ではWindows版のみですが、今後Mac版、そしてシステムの全体性能を見つつAndroid版にも順次搭載するとしています。

おわりに

というわけでATOK 2017の情報でした!

Android版ATOKにも、今回開発された深層学習エンジンが搭載されるということでATOKユーザーとして純粋に楽しみです!

はやく搭載を発表してほしいですね。。

それでは!

mamesuke

福岡出身、関西で学ぶ大学生。学生メディアとして、大学新聞で活動中。ガジェット好き、旅行好き、カメラ好き。鉄道もちょっとかじってます。

あわせて読みたい