「Siri」と「シーマン」の「人柄」の違い

「Siri」と「シーマン」の「人柄」の違いという記事がおもしろかった。

もちろん単純に、やり取りが面白いという話がある。記事から引用すると、たとえば、

●いま何時→
・「すみません、○○区が何時かわかりません」(Siri)
・「バンバンジー」「切れ痔」「銀閣寺」「いぼ痔」など(シーマン)
●何歳?→
・「その質問にはお答えできません」(Siri)
・「盆栽」「ザーサイ」「オレにトシを聞くのをやめろ」「は? けっこう若いよ、オレ」(シーマン)
●何座?→
・「私には理解できません」(Siri)
・「しゅうまい、じゃなくてギョーザ」(シーマン)

だというのである。

実は大学へ移って間もないころ、昔でいうところのAi(人工知能)の研究として、ブラックボックスでの置換え、つまりユーザに目隠しをして本物の人間と人工知能が区別が出来なければ、人工知能として完成、というシナリオを、もう一度考えてみたいと思ったことがあった。

その時に対象にしたのが、「ボケと突っ込み」のシミュレーションである。当然「シーマン」のことは頭にあったのだが。 「ボケと突っ込み」を評した本を何冊か買って、いろいろと考えてみた結果、いくつかの要素がありそうな気がした。 1つは、何をもっておかしいと感じるのか、ということだが、これはよくわからない。 もう1つは、とぼける要素(つまり「オチ」)としてダジャレ・地口(言葉の表層の類似性)、意味のひねり、人間性・思考でのひねり、などのレベルの違いがありそうだということだ。 この辺りは昔から落語家や落語評論家がさんざん議論しているところだろう。 でも、真面目に分析してみたいととても思う。

さて、上記のシーマンの例は、かなりダジャレ、というか、語の一部の音が似ていることを使っているように見える。「いま何時」の「じ(ぢ)」に対して、バンバンジーとか切れ痔とか銀閣寺とか言っているし、「何座」の「ざ」に対して「ギョーザ」と言っている。(「しゅうまい、じゃなくて」の部分はどう捉えようか?) これを単なる文→文の対応でなくやるとすれば、音が似ている語を探すことになる。 しかし、それほど単純でもあるまい。 音が似ているだけの語を選んだのでは、ちっともおかしくないのである。 なぜおかしいか? どういう語を選べばおかしいのか? もう少し調べる必要がある。

2番目の例の「オレにトシを聞くのをやめろ」や「けっこう若いよ、オレ」は、正常な応答システム、つまり問いの意味を理解して答えようとしているわけであるが、ただ答そのものがストレートでないだけである。 Siriの場合は知っていれば○○歳と答えるのだろうが、知らないので答えなかったと見なしたい。場合によっては女性の場合答えない、という情報を入れて置くのかもしれない。