人工無脳『笑うヤカン』が目指すもの

| | コメント(0) | トラックバック(0) この記事をはてなブックマークに追加

 未だ『笑うヤカン』の公開に至っていないオレが何を目指すというのか、って感じですが。
行き詰っています。
 笑うヤカンはPHP、JavaScript、MySQLという環境で動く人工無脳エンジンであり、性格付けを全てデータベースに依存させて複数のキャラクターを作れるようにするというのが基本方針で、それ自体はアルゴリズムとデータを分離するという基本的なアーキテクチャに沿っただけなのでなんら難しいことではない。キモはデータの保存形式とその使い道なわけだけど、試行錯誤を続けています。既に10回以上はデータの初期化をしてる。それもメガ単位のテキストデータを。
や、開発の面白さとその難易度に良い意味と悪い意味の両方ではまっているということです。開発開始を宣言したときに大したものを作るつもりはないと言ったのは自戒をこめてのことだったのだけれど、あっさり破ってしまった。
目指しているのは1対1の対話ができる人工無脳。これがだいぶ無茶なことだったということがわかってきたよ。

 とりあえずソースが公開されている有名な人工無脳ロイディの基本理念を拝見した。
名詞のみを学習していくという方法は単純ではあるが、生成される文章の意味が通りやすくなるということであればそれは人工無脳として正しい方向性だろう。
うずらについては想像するしかないのだけど、おそらく基本は単語と文章の関連付けで会話の中で重要なキーワードを判別したりしてるのではないだろうか。
2008年のうずら語録は素晴らしすぎる。
語録にない部分の発言がどのくらいの確度で会話が成り立っているのかその割合も想像するしかないのだけど、「人間らしく」というコンセプトに着実に近づいているように見える。

 そんな感じでいろいろと参考にしてます。
文脈に沿ったまともな返答をする。たまにこちらの予想しない答えを返す。
この2点のためにいろいろと学習方法や文章生成のアルゴリズムを作り続けているんだけど、やはり日本語そのものをある程度解析していかないといけないようだということに気付いた。
結果、動詞と形容詞の活用については自在に変換できるようにはなった。これはそれほど難しくなかった。文章パターンを元に生成させていちおう日本語を話すようになった。ただし単発。
なにかぼそっとひとこと残して去っていく、というスタイルならばそれで十分かもしれないが、目指しているのは1対1の対話ができるものだ。

 そこで人間同士の会話で、そのとき何がテーマになっているかを判別する必要がある。それも総論、各論の両面でだ。
単語、文章、文脈と学習する範囲を広げていったところでそれが何を意味しているのか(他の何と関連付けるのが正しい解釈か)を心得ていなければ返答はちんぷんかんぷんのままだからだ。
ただ困ったことに英語と違い日本語には主語が無い。びっくりしたけど確かに無い、あるいはとてもあいまいなんですな。
「日本語のセンテンスは必ずしも主格のあることを必要としない」と谷崎潤一郎氏も言っている。
「良い天気だ」「象は鼻が長い」とかね。「古池や蛙飛び込む水の音」とかもうどうやって解析したらいいのか倒れそうになる。
あるいはテーマが明確であれば、ひとつの文章としてみた場合に不完全であるほど意味がより深く伝達される、という側面もあったりする。暗黙の了解というやつで。
だからテーマが何なのか判定する指標が無い......いや、ロジックとして構築しづらい。なんとかここをクリアしたいのです。

 ...というところです。現状は。もうね、日本語の文法とか、そもそも~みたいな本とかを立ち読みしてるオレがいますよ。普通にふむふむとか言いながら読めてるオレもいますよ。こんな形で文系方面に興味がわくとは思ってもみなかった。
もはや人工知能との境界がゆらいできた感じですが。いや、理論ばっかり先行して成果が上がっていないから困る。上で言ったことが仮に実現できたとしても、まったく見当違いで予想通りの結果にならない可能性のほうが高いしねえ。
ま、永遠のベータ版でもなんでもとにかく公開しちまうって手もあるんだけどね。もうちょっと頑張ってみます。はい。

長くなりましたがそんな感じです。
よしなに。

トラックバック(0)

このブログ記事を参照しているブログ一覧: 人工無脳『笑うヤカン』が目指すもの

このブログ記事に対するトラックバックURL: http://www.studio-wiz.com/mt/mt-tb.cgi/100

コメントする

このブログ記事について

このページは、マピロが2009年1月21日 19:02に書いたブログ記事です。

ひとつ前のブログ記事は「今週の『バクマン』」です。

次のブログ記事は「人工無脳『笑うヤカン』のための考察。脳というデバイスについて」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Powered by Movable Type 4.14