スロットの作り方❷

❶ Number

  • 全ての数字(アラビア数字・漢字)をタグします

  • 電話番号のような独立した数字は別個にタグします

  • 「二十五枚」のような助数詞を使う場合は、助数詞以外の数字をタグ付けします

"kyuu" という発音に対して「9」(数字)と「級」(助数詞)が混同しないようにさせるには、新しく”助数詞スロット"を用意して、その中に認識させたい助数詞を前もって指定しておきます。またTraining Sampleの中で数字と助数詞を別々にタグ付けます。こうすると指定されかった助数詞が排除され、音声認識の精度が高まります。

❷ Dates & Times

日付・時間を一括でタグします。

❸ Temperature

全ての数字(アラビア数字・漢字・ひらがな)と温度単位をまとめてタグします。

❹ Percentage

「パーセント」はカタカナ又は半角の%で表します。全角の%は無効です。

この画像の例のように「数字」と「数字+パーセント」は別のスロットとしてタグ付けします。

❺ Duration

時間の長さを表す単位(間など)を近似値(くらい・約・およそ)を表す言葉も含めてタグします。近似値の表現によっては「近似値」として認識されないこともあります。(Fixed in the grammar and to be updated in the next release)

Built-inのリストにない単位はその都度新しく専用スロットを作り、「バリュー」を定義したあと、トレーニングサンプルの中で数字と別々にタグ付けをします(例 ワット数)