Microsoft Office 2010 IMEが東方に強いと言う噂を聞いたので検証してみた

Microsoft Office 2010 IMEが東方に強いと言う噂を聞いたので検証してみたら、本当に強くなっていた。

事の経緯

Twitterのアカウントで、MS-IMEへの不満を書いたら、MicrosoftでIME開発をしている人 (自称; 当記事執筆時の自分には、該当アカウントのユーザーがMicrosoftの社員であると断言できなかったのでこのような表現になった) にMS-Office 2010のIMEを勧められ、更にTwitter / Takashi umeoka: @rh_kimata 東方に強いという、うわさもありますよと言われたので、検証してみた。

検証環境

Windows 7上のXP modeに2009年12月12日時点のMicrosoft Office Professional Plus 2010 Betaの32bit版をインストールして検証した。なお、比較対象はXP modeの初期IMEであるMS-IME Standerd 2002 Ver. 8.1とし、両方ともインストール後、に2009年12月12日時点のパッチを全て当てた上で、学習機能を切った状態で試験を行った。

検証項目は、東方project作品で良く出るキャラクター名と作品名を対象とし、以下の基準で判定した。

  • 正しい変換結果が、カタカナになるものはテスト項目から省いた (例:「パチュリー」、「レミリア」など)
  • 変換候補の中に正しい変換結果があれば "○" とした (第一候補でなくてもよい)
  • 変換の範囲を単語全体に指定しなおせば変換候補に正しい変換結果が出る場合、注釈付きで "○" とした
  • 単語を変換結果の文字ごとに分解して変換すれば変換候補に正しい変換結果が出る場合、その単語をIMEが知らなかったと看做し "×" とした。ただし、変換範囲を再指定することなく、正しく変換できる場合、その旨の注釈を付けた
  • 正しい品詞として変換候補に挙がっているかどうかはテストの対象外とした (例:「霊夢」「霧雨」「十六夜」などは人名ではない品詞として変換されていると思われるが、正しく変換出来れば "○" とした)
  • 正しい読みが分からなかった単語は、一般的に読みが想定できるパターンでテストした (例:「星熊」は「ほしくま」と「ほしぐま」の両方をためした)
  • 読みに旧字の "ゐ" を含むものは、"い" と "うぃ" の両方でテストした (「てゐ」及び「ひななゐ」)
  • テスト項目の選定は木俣の感覚による恣意的な物で、「大妖精」「小悪魔」などは一般名詞として対象外とした一方、「霊夢」「霧雨」「十六夜」などはテスト項目とした

なお、テストデータの作成には、東方IME的なものの辞書データを流用させていただいた。普段、この辞書を使わせていただいていることも併せて、この場で改めて作者のmoki氏に感謝の意を表する。

検証結果

全129項目中、MS-Office 2010 IMEは "○" 判定が65項目 (約 50%)、MS-IME Standerd 2002 Ver. 8.1は "○" 判定が28項目 (約 22%) であり、MS-Office 2010 IME東方projectの単語に強くなっていることが確認できた

東方関連の単語の、MS-Office 2010 IMEMS-IME Standerd 2002 Ver. 8.1の変換結果比較
読み正解MS-Office
2010 IME
MS-IME
Standerd
2002
Ver. 8.1
備考
はくれい博麗注1×注1: 変換範囲を "はく" + "れい"から、"はくれい" にする必要あり
れいむ霊夢-
きりさめ霧雨-
まりさ魔理沙×-
ほん××-
めいりん美鈴××-
いざよい十六夜-
さくや咲夜×-
ちぇん××-
こんぱく魂魄-
ようむ妖夢×-
さいぎょうじ西行×-
ゆゆこ幽々子×-
やくも八雲-
らん-
ゆかり-
ようき妖忌××-
かみしらさわ上白沢×注2×注2注2: 初期の変換範囲の "かみ" + "しらさわ" で変換可能
けいね慧音×-
いなば因幡-
てうぃてゐ××-
ていてゐ×-
れいせん鈴仙×-
うどんげいん優曇華院×-
やごころ八意×-
えいりん永琳×-
ほうらいさん蓬莱山××注3注3: 初期の変換範囲の "ほうらい" + "さん" で変換可能
かぐや輝夜×-
もこう妹紅注4×注4: 変換範囲を "も" + "こう"から、"もこう" にする必要あり
すいか萃香×-
しゃめいまる射命丸×-
かざみ風見-
ゆうか幽香×-
おのづか小野塚-
こまち小町-
えいき映姫×-
しずは静葉×-
みのりこ穣子××-
かぎやま鍵山-
かわしろ河城××-
いぬばしり犬走××-
もみじ-
こちや東風谷×-
さなえ早苗-
やさか八坂-
かなこ神奈子××-
もりや洩矢×-
すわこ諏訪子×注5×注5注5: 初期の変換範囲の "すわ" + "こ" で変換可能
ながえ永江-
いく衣玖××-
ひななうぃ比那名居××-
ひなない比那名居××-
てんし天子-
くろだに黒谷-
くろたに黒谷-
みずはし水橋-
みずばし水橋×注6×注6注6: 初期の変換範囲の "みず" + "ばし" で変換可能
ほしぐま星熊×注7×注7注7: 初期の変換範囲の "ほし" + "ぐま" で変換可能
ほしくま星熊××注8注8: 初期の変換範囲の "ほし" + "ぐま" で変換可能
ゆうぎ勇儀××-
こめいじ古明地××-
かえんびょう火焔猫×注9×注9注9: 初期の変換範囲の "かえん" + "びょう" で変換可能
りん-
れいうじ霊烏路××-
うつほ××-
たたら多々良-
こがさ小傘××-
くもい雲居-
いちりん一輪-
うんざん雲山××-
むらさ村紗××-
みなみつ水蜜××注10注10: 初期の変換範囲の "みな" + "みつ" で変換可能
とらまる寅丸×注11×注11注11: 初期の変換範囲の "とら" + "まる" で変換可能
しょう××-
ひじり-
びゃくれん白蓮-
ほうじゅう封獣××-
みょうれん命蓮×注12×注12注12: 初期の変換範囲の "みょう" + "れん" で変換可能
ひえだ稗田-
あきゅう阿求×注13注13: 初期の変換範囲の "あ" + "きゅう" で変換可能
あれ阿礼××-
あいち阿一××-
あに阿爾××-
あみ阿未××-
あよ阿余×注14×注14: 初期の変換範囲の "あ" + "よ" で変換可能
あご阿悟××-
あむ阿夢××-
あしち阿七×注15×注15: 初期の変換範囲の "あ" + "しち" で変換可能
あや阿弥××-
もりちか森近注16注16: 変換範囲を "もり" + "ちか" から、"もりちか" にする必要あり
りんのすけ霖之助×-
ときこ朱鷺子××-
うさみ宇佐見-
れんこ蓮子××-
たつき綿月×注17×注17注17: 初期の変換範囲の"わた"+"つき"で変換可能
とよひめ豊姫×注18×注18: 初期の変換範囲の"とよ"+"ひめ"で変換可能
よりひめ依姫××-
れいいでん靈異伝×注19×注19: 初期の変換範囲の"れい"+"いでん"で変換可能
ふうまろく封魔録××-
ゆめじくう夢時空×注20×注20注20: 初期の変換範囲の"ゆめ"+"じくう"で変換可能
げんそうきょう幻想郷×注21注21: 初期の変換範囲の"げんそう"+"きょう"で変換可能
かいきだん怪綺談××-
こうまきょう紅魔郷×-
ようようむ妖々夢×-
すいむそう萃夢想×-
えいやしょう永夜抄×-
かえいづか花映塚×-
ぶんかちょう文花帖×-
ふうじんろく風神録×-
ひそうてん緋想天×-
ちれいでん地霊殿×-
せいれんせん星蓮船××-
ひそうてんそく非想天則××-
ぐもんしき求聞史紀××-
こうりんどう香霖堂×-
さんげつせい三月精××-
ぼうげっしょう儚月抄××-
ぼうげつしょう儚月抄×-
しこうばな紫香花×注22×注22: 初期の変換範囲の"しこう"+"ばな"で変換可能
れんだいのやこう蓮台野夜行××-
ゆめたがえかがくせいき夢違科学世紀××-
ぼうゆうとうかいどう卯酉東海道××-
ようがく幺樂××-
ようがくだん幺樂団××-
げんそうきょくばっすい幻想曲抜萃××-
ぜんじんるいのてんがくろく全人類ノ天楽録××-
ぶんぶんまる文々。××-
ひふうくらぶ秘封倶楽部×注23×注23注23: 初期の変換範囲の"ひ"+"ふう"+"くらぶ"で変換可能
げんがくだん幻樂団×-