まず問題の翻訳を見てほしい
コーディング規則 - Visual Basic | Microsoft Docs
IsNot キーワードの使用
英語
Use the IsNot keyword instead of Not...Is Nothing.
自動翻訳(誤訳)
IsNot の代わりに Not...Is Nothing キーワードを使用します。
イベント処理
英語
Use Handles rather than AddHandler:
自動翻訳(誤訳)
Handles ではなく AddHandler を使用します。
記事にした経緯
どちらも見事に逆になっているわけです。
上の問題は こちらの記事で参照して気づきました。
下については @tfukumoriさんがフィードバックされています1。
そしてこちらが Microsoft Localization Team からの回答です。
現在、機械翻訳されたコンテンツに対する翻訳の問題へのコントリビューションはできません。
人間が翻訳したコンテンツに関するフィードバックやご意見をお寄せください。人間が翻訳したコンテンツは機械翻訳エンジンをトレーニングするために使用されているため、お客様は、時間が経つにつれ人間および機械の両方による翻訳の質を向上させることに貢献できます。
人間が翻訳したトピックは、各コンテンツ ファイルのヘッダーの translationtype メタデータ値 "HT" (機械翻訳の場合は "MT") によって、機械翻訳されたトピックと区別できます。
そうですか。
貴重なフィードバックを放置して、何を契機にどんな改善を機械に期待しているのでしょうか。
一度飲み込んで五晩寝たものの、疑念が去らないので記事にしました。
※気になって仕方がないわけでも、怒っているわけでもありません。
ただ、サイトの影響力の大きさから、(今回の件に限らず)誤った情報が広がってしまうのを心配しています。
つまりこういうことですね?
軍にAI兵士を導入しました。
兵卒「マイクロソフト上官、AI兵士が味方の兵士を次々撃ち殺しています」
MS上官「味方を誤射した兵士がいて、どうも真似しちゃったらしいんだ。誤射した兵士を鋭意教育中だから、そいつが成長してAIが学び直すまで待ってくれ」
ほかの機械翻訳では?
たとえば Google 翻訳はフィードバックを積極に活用しています。
Google 翻訳の改善に協力する - Google Translate ヘルプ
翻訳コミュニティ
最近話題になった悪用の懸念も悩ましいところですが、近年の精度の向上を見るに、一定の成果は上げているのではないかと思います。
今回のような「真逆のこと言ってるじゃん」ということは Google 翻訳でもあるわけですし、将来を見据えた意欲的な試みも歓迎される分野ですから、一概にどちらが優れているとは言えないと思います。
人々の期待
機械翻訳の精度が10年前と比べて格段に上がりました。
それに応じて人々の機械翻訳に対する信頼度も上がっています。
昔よりも信じやすくなっているわけですから、より高いレベルで改善・向上が求められているとも言えます。
本当に機械学習の問題?
ところで今回の件、本当に機械学習の問題でしょうか。
"A instead of B Nothing" ⇒
「Aの代わりにB」
"A rather than B" ⇒
「AではなくB」
機械学習がどうこう言うレベルの間違いではない気がします2。
フィードバックをちゃんと読んだのだろうか。
これまたコーディング規約関連で、『型のメンバーの名前』に対する こちらのフィードバックでは、最終的に謝罪、訂正(ここでは「人間翻訳」化)となったわけですが、初動の機械回答感はひどいと言わざるを得ません。
Microsoft コミュニティのモデレータさんも、結構な頻度で同じ匂いのあしらい方をされますよね(こちらは役割が異なるとは思いますが)。
そういった文化、方針なんでしょうか。
機械ではなく人間の問題だと思います。
具体的には、担当部署の姿勢、企業のリソース割り当て(重要度の認識)の問題ではないでしょうか。
機械翻訳に完璧を求めるわけではありませんが、改善に協力しようと真っ当な指摘をした人に対して感謝と敬意を持ち、本当に機械学習の成熟度の問題なのか切り分けたうえで、可能な範囲で真摯に対応する姿勢は見せてほしいです。
というか、もったいないですよね? こんな凡ミス放置するの。
改元対応の問題でもそうでしたが、日本語ローカライゼーションが重要と位置づけられ、そこに適切なリソースが割り当てられているとはとても思えません。
ちょっと悲しいところです。
自省(頼りすぎ、期待しすぎ)
少し強い表現になってしまったかもしれません3。
意見の偏りもあると思います。
そもそも私が機械翻訳に頼りすぎています。
特に正確さが求められる技術ドキュメントは、できるだけ原語で読むのが原則だと思います。
機械翻訳の精度が上がってきたこともあり、つい便利さに甘えてしまうことが増えました。
英文読解力はみるみる落ちてきました。
これではいかんと、最近はなるべく原語で読むよう(機械翻訳見ちゃったとしても最終的には原語にあたるよう)心がけています。
ということで、本当の問題はここにあったのかもしれません。
書き終えてから Microsoft コミュニティにこんなスレッドを見つけました。
日本語によるフィードバックは、ほぼ無視されているコトが発覚しました。 - マイクロソフト コミュニティ
本国MSでは、日本語のフィードバックを、自動翻訳で英語に訳して読んでいるらしい。