3種の画像認識No1「秋田犬」「ダックスフント」「パグ」

Neural Network Consoleで「秋田犬」と「ダックスフント」と「パグ」の画像認識を試してみます。

①google画像認識で、「パグ」の画像をダウンロードします。次にフォルダ「Pug」に「パグ」の画像109個を入れました。それをフォルダ「akita」フォルダ「Dachshund」が入っている「DogdataOrg」に入れます。

②左の「DATESET」を選択します。「+Creat Dateset」をクリックします。「Source Dir」に「DogdataOrg」を指定します。空のフォルダ「Dog3_dataset」を作っておき、「Output Dir」に指定します。「Shaping Mode」はTrimmingを選びます。「Output Color Ch:」は「3 (RBG)」、「Output Width」「Output Height」は128にします。トレーニング用「Output File 1」は85%、チェック用「Output File 2」は15%にしました。

③先ずはsampleに入っている「binary_weight_minist_MLP.sdcproj」を参考にします。

④「+New Project」をクリックします。EDITタブ左のComponentsにて、Input、BinaryWeightAffine、ReLU、Softmax、CategoricalCrossEntropyをダブルクリックしNetwork Graphにレイヤーを追加します。

⑤Inputレイヤーをクリックして選択し、Layer PropertyのSize(クリックして入力)に変数x(入力データ)のサイズである3,128,128を入力します。(「3 (RBG)」,「Output Width 128」,「Output Height 128」)

⑥BinaryWeightAffine_4レイヤーをクリックして選択し、Layer PropertyのOutShapeに3を指定します。

⑦「DATASET」をクリックして、その下の「Open dataset」もクリックして「Training」に「Train3.csv」をセット。

⑧「Validation」に「test3.csv」をセット。

⑨test.csvを開いてみます。データが50個あります。

⑩「CONFIG」で「Batch Size」を50にします。そして「Structure Search:」を「Enable」にします。学習実行ボタン(ショートカット:F5)を押して連続して学習します。何回か繰り返し実行したら、□ボタンでストップします。学習結果を一つづつ「Evaluation」ボタンをクリックして、評価します。

⑪学習開始直後です。

⑫だんだん進みます。

⑬データ数が少ないので、五分半ほどで一回終了です。

⑭一回目の結果です。Output Resultをチェックして表示しています。

⑮一回目の結果です。Confusion Matrix:をチェックして表示しています。

⑯三回目の結果です。Output Resultをチェックして表示しています。

⑰三回目の結果です。Confusion Matrix:をチェックして表示しています。

データが少ないのでAccuracyすなわち精度は、両方とも0.76です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です