フリーな会話ですとねこはちさんの書かれてるような感じになりそうですが、数個の単語限定ならばもっとシンプルに出来るかもしれません。
・自分で「りんご」としゃべった波形を保存
・プログラムでマイクを使い遊んでる人にしゃべらせ、サンプリングした波形と保存したりんごの波形を比較し、どのくらい近いかを数値化
・数値が一定以上なら「りんご」と認識
私も素人ですのでこれなら大丈夫、というわけではありません。思い付きに近いです。
あと、メカロ・デラックスさんがどのくらいプログラムに慣れているか判断できなかったのですが、上のやり方でも数学的、物理的な知識をいろいろプログラムにする必要がありそうです。
1そうだね プレイ済み