目標達成は簡単そうだからではなく、難しいからこそ追求しよう! 大失敗を恐れない者だけが、偉大な事を成し遂げる。

2013年8月1日木曜日

自動翻訳は無理

ドイツ語で「Ich muß Brot essen」という文章は、英語で「I must eat bread」、フランス語で「Je dois manger du pain」と言う。語順は少しだけ違っていても、主語、(話法の助)動詞、目的語や動詞は必ず入っている。そして、ヨーロッパの言葉ではこういう「話法の助動詞」の入っている文章は極簡単に辞書で調べられる。大体の場合、「Ich」(私)、muß(しなければならない)、「Brot」(パン)と「essen」(食べる)を独英、独仏の辞典で引けば、動詞変化を最初から正しく言えなくても、かなり快適に文章が作れる。但し、日本語だけは

そうならない。自分の日本語勉強暦を思い出せば、「な~んで話法の助動詞はこんなに複雑に言わなければならないのだろうか」と悩みながら思っていた覚えがある。西洋の言葉では一言で言える話法の助動詞は他にもある(ここではドイツ語で言いたいが、皆様が英語の方が馴染みがあるので英語で言う):
  • must          ・・・しなくてはいけない、しなければならない、せねば、しないと等など
  • must not      ・・・しなくてもいい
  • may           ・・・してもいい
  • may not         ・・・してはいけない
  • can             ・・・することができる
  • shallshould    ・・・するべきである
  • want            ・・・したい、するつもり
  • would like       ・・・できたらやりたいのですが、したい
  • will               ・・・するでしょう
それぞれを習うのに外国人は最初凄い違和感を持ち、大変な思いをする。

日本語の名詞には性別がないし、複数形で変化もしない。動詞は人称代名詞によって変化せずに使えるし、形容詞、副詞、前置詞という様な単語も、特にドイツ語ほど変わらない。5年前に出した、3番目のビデオの題名は「日本語の簡単さは反って難しい」それこそテーマにしていた。文法は簡単過ぎて困る。勿論のことで、その反面には僕の永遠の悩みである慣用句、擬声語、擬態語とその他の日本語の一部も反って超難しいよ~。多くの外国人にとって漢字と仮名もかなりの障壁である(僕は大好きだけど・・・)。

一つは決まっている: 西洋と東亜の言語の仕組みは違う。日本語では上記の問題の他に幾つかの別の特徴がある。単語と単語の間にはスペースがない。大文字もないし、句読点も違う。動詞の変化は人称代名詞によって変化するよりも時制によって変化する。その反面には、西洋の言葉にない現象で、形容詞は時制によって変化する。数字の仕組みも違う:西洋での10.00010かける1000で、日本では1かける10000である等など。それらの事情はあくまでも例に過ぎなくて、言語学的にじっくり調べれば、もっと、もっと沢山の相違が見つかる。

ナイストライだが、完璧は一生無理

ということで、僕は断言する: コンピューターによる自動翻訳は、少なくても今世紀中に無理!
コンピューターは基本的に馬鹿!行間を読むことは出来ない。ニュアンスも駄目。皮肉も理解できない。嫌味も駄目。含まれている感情も解釈できない。無理、無理、もしかして永遠に無理かもしれない。勿論、要約ぐらいは今でも出来るけれども、人間の翻訳者が成し遂げられる出来には一切付いていけないと思う。今世紀末まではあと85年以上もあるが、どんなコンピューターを使っても、人間のクリエイティブな頭で作成された文章を問題なく、正しく、100%人間翻訳者の様に訳すことは絶対出来るようにならない。言葉の作成可能範囲は音楽の音符と同じ様に豊富なので、人間は不可欠!

それを少し裏付ける為に、色んな種類の書籍を持ってきて、グーグルの(確かに一時的に便利な)翻訳ページに入れてみた。中には、そのまんま残せる文章は一つもない。例え、日本の人口は126万人しかいない?そんなのも正しく訳せないの?と訊きたくなる。従って、僕の断言した事を次ので、お確かめ下さい:

ドイツのWikipediaで、日本の事について:
日本はアジア大陸の東海岸沖国です。世界で面積の点で4番目に大きな島の国は基本的に人口が集中するための4つの主要な島々で構成されています。 126万人以上の住民で、日本は世界で10番目に人口の多い国にランクされています。日本の状態は、憲法は国家元首として君主を祀っていること、しかし、なしで、1947年以来、立憲君主国である。日本の事実上の首都であり最大の都市集落は、東京です。日本は高度に発達した工業国であり、長年にわたり、米国に次ぐ世界第2位の経済大国が、そのとそれは1952年から軍事同盟されていた。日本は八のグループの一員です。国家の形成は、第五年に日本で始まった中国の帝国の文化的影響から世紀。 16日以来世紀日本が西洋と接触していたと19日以来、上昇している上の大国として世紀、植民地を買収し、二つの世界大戦に参加した。中国では拡大の積極的な政策は、太平洋戦争と枢軸国側の敗北につながった。植民地と占領、日本の過去はまだ隣国との関係を負担。

ニュースで、メルケル首相が国防大臣を応援している事について:

トーマスデメジエールの剥離が首相のため論外です。報告書によると、メルケル首相は、内部の議論でそれを明確にしました - 辞任の申し出に応じて、それを受け入れないだろう。国防長官は、大きな圧力の下にドローンの事件である。

ドイツの基本法(憲法)からの抽出:
人間の尊厳は不可侵である。尊重し、保護するためには、すべての国家権力の義務である。ドイツの人々は、したがって、世界の平和と正義のあらゆる社会の基礎として不可侵と不可分の人権を認める。
以下の基本的な権利は、立法、行政および直接適用法として司法をバインドしなければならない。

ドイツ民法の中にある、時効についての条:
時効の無知で行われている場合でも陳腐クレームアドバンスの満足に、回復することはできません。同じことは、契約上の承認と同様、債務者の安全にも当てはまります。

トーマス・マンの傑作、ブッデンブロークの一家の冒頭
と非常に軽い玉虫色シルク、祖父の顔から離れて少しかなり金髪頭で作られたドレスに建て少しアントニー、8歳と入札は、再び繰り返され、ハードと部屋の中には何も見ずに考える彼女の灰色の青い目の外を見た。 "それは何ですか、私は私の神は、"彼女の顔は、すぐに、自分自身を明確にしている間に、追加された"と信じている"それは、ゆっくりと言った" - 作成し、すべての生き物は"突然スムーズシートと今ごろごろに落ちていた、幸せに晴れやかなと容赦なく、記事全体、したがって、公教要理に忠実で、彼のように、今年1835年に、最近になって新たに改訂された許可証は、高の下で発行され、おそらく上院を持っている。あなたがしたい場合は、起こっていた場合、彼らはそれはあなたが兄弟と小さな手のそりで冬に"エルサレムの山"をダウン運転した時のような感じだと思った、それはここで実に思考を渡され、あなたが会うことができなかった。

ゲーテの詩、Wandrers Nachtliedの一部:
すべてのサミット上記、穏やかな
すべてのトップスであなたをSpürest
ほとんど息;鳥は森の中で沈黙している。
ただ、すぐに、待って,またあなたをRuhest

納得得られましたでしょうか? 


8 件のコメント:

  1. でもロルちゃん、わかんないよ~!
    生まれてきたばかりの赤ちゃんは何も知らずゼロから...
    ということは、万能ロボットや完璧翻訳も遠からずやいつかはできると考えられる(?)!
    ライト兄弟の飛行機からわずか100年ほどで現在のジェット機...etc.
    85年という長い年月の間には予想もつかないことが起こり得そうです...

    返信削除
  2. いや、ここは(珍しく)断言します。
    僕が言っているのは、あくまでも「完璧な」、人間翻訳者同様の出来との事です。
    ニュンス、行間、皮肉、感情、本音、建て前等々を全部察す機械です。
    もしあんな物ができたら、人間が実に、実に要らなくなるでしょう。
    アインシュタインも最後までに物理学の「万物の理論」を見つからなかったと同じように、言語学のあの理論は誰一人も見つける力がないと思います。無理、無理、あり得ないです。
    ライト兄弟の発明をあれと比べられないでしょう。数千年間人間が鳥達が飛んでいるのをずっと見てきていたし、多くの(人間の)試しの失敗も公表されていたお蔭でも、ライト兄弟は比較的に楽勝だったでしょう。いやいや、あれは、言語の秘密とは比べられないですね、全然!
    コメントありがとうございます!  でも、僕は言い続けます・・・!

    返信削除
  3. それでもお言葉ながら...
    85年後には完璧な翻訳が可能な完璧なロボット(サイボーグ?)が現れている可能性もあるのでは?
    ライト兄弟の頃の人々が、まさか100年後に現在のジェット機や月や火星(にも?)に行くことを予想できたでしょうか?

    返信削除
  4. 例えば、複数の意味を持つ形容詞や名詞や動詞などを翻訳するに当たって、どの意味が正しいのかをコンピューターに正確に判断することが出来るのか。人間でも難しい、出来ない場合もあるのにコンピューターには無理なのではないかと私も思います。

    返信削除
  5. Ich muss Brot essen.
    Google先生によると、「私はパンを食べる必要があります」だそうな。
    うーん。確かにニュアンスが違いますな。

    返信削除
  6. りんごほっぺ2013年8月7日 16:50

    いつも楽しく拝読しています。 言語だけは、コンピューターに頼ることはできないということですね。 私も、勉強中の身ですが、 コンピューターのような馬鹿にならないようにします(汗)。  

    返信削除
  7. 断言できるのは(世の中で確実なのは)、生き物いはいつか死ぬことだけ... とは、あの織田さんが言ったそうです。

    言語も既にコンピューターに頼っています... 例えば販売ならグーグル翻訳でもビジネスでも通用します。注文書とか、何をいくつとか...

    文明の利器に頼りすぎると人間は馬鹿(柔)になります。乗り物と食事の発達で身体を動かさなくなって(他にもありますが)生活習慣病が現れて、ワープロで字を忘れて...

    でもその流れは誰にも止められませんね...

    返信削除
  8. ネットで書いてるからコンピュータ万能と言いたい人が多いのは事実でしょう。
    しかし、コレだけは言いたい

    〜〜会話教師 とか 〜〜翻訳/通訳者 は滅んでほしい。それだけは機械で代行してもらいたい。

    でないと上の人が言う様に、人間がバカになるだけかと思います。(そして〜〜会話教師/翻訳/通訳者が私腹を肥やす。まあどの世界もその様な人々がいる)

    他言語習得は難しいという人がいるけど、それも結局は固定概念みたいなモノで便利さに負けてる。
    勘違いしないでほしいのは、誰だってどの言語でも習得できる(はず)。そしてそれがもっと速い(つまり便利?)かもしれないのに機械で代用しようとする。

    もうコンビュータでさえ遅れてるかも知れないのに。。。

    返信削除