etc / レポート

backspace.fm:元Apple日本語開発リーダー木田泰夫氏インタビュー「Appleの日本語環境を支えた、これまで語られなかった20年」#backspacefm

※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。

AUGM KOBE 2016において、トークショー参加のため会場にいた元Appleシニアマネージャーの木田泰夫氏に、backspace.fmのポッドキャストインタビューを行い「Danbo-side #001: Appleの日本語環境を支えた、これまで語られなかった20年」として配信されています。

Podcast「backspace.fm」は、iOSアプリ「Podcast」で、Mac/Windowsでは「iTunes」などで視聴出来ます。



Apple Keyboard II JIS

Apple Keyboard II JIS

1988年に発売された、ASCII配列のキーボードをベースにした「Apple Keyboard II JIS」(1990年にescape、capslock、controlキーの位置が現スタイルに変更される)は、木田氏が考えたキーボードで、それまでのなんちゃってキーボードから、英語入力と日本語入力の切り替えを「かなキー」を押すことで簡単に実現することが可能になった製品だそうです。

これをトグル切り替え(iOSの入力言語入力方式のような感じ)にしなかったのは「脊髄で学習出来るようにしたかった」(体で覚えられるようにする)からだそうです。


当たり前に使われている「日本語を変換する」という行動は、OS Xのハードウェアキーボードから入力したキーを元に文字を推測するのと、iOSのように外側から一体化した入力を行うキーを元に文字を推測するのとを比較した場合、iOSの方がより多くの推測候補を提示する必要があるのだそうです。

また、iOSの文字推測は「単文」による文章を形成する必要があるそうで、コーパス(テキストや発話を大規模に集めてデータベース化した言語資料)の中に自然と入ってくることから「ギャル語」や「流行語」も変換可能になっているそうです。ただ、全てではなく精査は行っているそうです。


日本語入力エンジンを開発する上で、ジャストシステムの場合は「ATOK監修委員会」(2013年に解散)まで作り、正しい日本語変換を目指し、Googleの場合はその対局にあり「ネットワークに流れてくるものは全て日本語」だと考え、Appleは、流行語については遅れて追随しながら、ネットワークに流れている言葉は日本語だと判断し、レビューを重ねて実装する方式をとっているそうです。

新聞文章は読ますための文書であり、会話やSNS投稿の文書として使うと使いにくい文章で、ユーザーの会話から外れたものになってしまうそうです。


iPhoneで「全角スペース」を入力出来ない(iPadは「全角」キーを押すと全角スペースを入力可)件について質問すると、文字入力の歴史として、8ビットに半角カナが入っていて、Shift_JISの中に全角英数字が出来てしまったという経緯があり、この日本語英数字(和製英数字)がユーザーを混乱させてしまうため、半角カナの変換を出来ないようにして、さらに全角英数字入力も出来ないようにしたかったんだけど、それしか入力を受け付けない入力フォームが存在するため、撤廃するには至っていないそうです。

スペースもその流れの中にあり、全角スペースという存在意義はあるが、入力インターフェースを出来るだけ簡単にしたかったという思いがあるため「スペースは単なる空間」という考えのもと、半角スペースのみに敢えてしているそうです。また、ユーザーからの要望として上がっていることは分かってはいるが、単純化するために排除しているのだそうです。


Microsoft IMEやATOKなどのインプットメソッドを意識しているか?と質問すると、この測定はとても難しく、デフォルトの状態で使ったとしても、直ぐに使い始めた状態と、1年間使ったあとの変換精度はどうなのか?なのかを比べるだけでも違っているし、「使い勝手における快適性」で評価する必要があるため、とても奥が深い分野なのだそうです。

日本語変換開発においては、機械学習の専門家、言語学の達人、言語のフィルターを行う多くの言語レビュアーなど多くの人によるチームが必要なのだそうです。


木田氏によると「Googleのインプットメソッドは、キャンディの上にシュガーコーティングされているようなもの」と表現し、語彙がとても多いため、文を発見すると「あ!」という感動体験によって、変換精度が高くなくても使いやすいと感じるのだと思うと説明し、ATOKは単体製品としての研究精度が高く「ATOKは使い心地を一生懸命考えている」と評価し、正しく変換出来る精度とは「車のエンジン馬力が大きければ、その車は使いやすいとは言い切れない」のと同じだと話してました。


中国語入力には手書き文字認識機能が実装されているが、日本語でも手書き文字認識は必要なのでは?と質問すると、プライオリティはかなり低いとしながらも日本語でも有用な場面はあると思うので、Appleが早く実現して欲しいと思っているそうです。

この中国語入力における手書き文字認識機能が実装された背景には、同じ文字体系なのにも関わらず、1つの漢字が地域によって発音が違う場合が多く、北京語広東語上海語七大方言)など、ローマ字入力では追いきれないため、必要になったのだそうです。


Mac OS X v10.3 "Panther"から、日本語入力として「アイヌ語」が追加されていることに関して質問すると、2002年3月に改定された Unicode 3.2 から JIS X 0213 に追随する形でアイヌ語カナ表記用の拡張カタカナが追加されたが、規格化されてはいるが、それを変換入力する方法が無い状態だったため、Appleがやるべき事だと考えて実装したのだそうです。


絵文字の普及に関して質問すると、一番最初にUnicodeへの絵文字の規格化を提案したのはGoogleだが、そのまま店晒し状態になり、Appleもモバイル市場参入において必要となり、Emoji beckのプロポーサルを提案したことで再び動き出し、GoogleとAppleとで共同活動し始めUnicode 6.0でサポートされたのだそうです。

この絵文字は、1つの文字体系で世界で意味通用する新しい文字ではあるが、その元になる各国の読みはことなり、1つの文字に複数言語のよみを付ける方法はあるのか?と質問すると、そうした研究は行われているので、みんなががんばるしかないと話してました。


今後の文字変換の未来について質問すると、言語解析における進化は目覚ましく、倍々に推測候補を出す方法や、すでに何を入力しようとしているのかを未来予測するとか、さらに賢い方法は生まれてくるだろうとし、そもそもApple Watchのように文字入力しようにもキーボードを持たないデバイスではどうするのか?など、まだまだ文字入力の進化は止まらないと考えられるそうです。


関連エントリー
AUGM KOBE 2016:Appleヒストリートークライブ
Appleのソフトウェアエンジニアリングマネージャー木田泰夫氏が退職
大阪DTPの勉強部屋:第2回鳥海修の文字塾「ヒラギノ書体」「游明朝体」「游ゴシック体」「キャップス仮名」のコンセプト(前半)
大阪DTPの勉強部屋:第2回鳥海修の文字塾「ヒラギノ書体」「游明朝体」「游ゴシック体」「キャップス仮名」のコンセプト(後半)



関連記事

この記事のハッシュタグ から関連する記事を表示しています。

新着記事