やってみよう!

プログラミングとかでぃーぷらーにんぐとかVRとか気になったものをやってみる予定

雑に作ったデータセットでYOLOv3を学習させてみる

前回に引き続きYOLOv3ネタです blog.ascreit.com 前回、チノちゃんがトイレと認識されてしまったり、そもそも主要キャラクターがあまり人間判定されなかったりしたので、今回はそれを改善してみようと思います。 でも、アノテーションを自力でポチポチ作るの…

YOLOv3を試してみる

ディープラーニングを何か試してみたいけどデータセット作るのが面倒 なので、自動で人物を見つけて切り抜いてくれないかなと探してみたらYOLOv3というのがあるらしい。 github.com 動かし方はほぼREADME.md通りでよくて、 qiita.com 動かしてみた系の記事も…

nvidia-docker+docker-composeでtensorflow-gpuのディープラーニング環境を構築する

ubuntu18.04でディープラーニングの環境(tensorflow+keras)を整えたのでメモとして残しておきます。 本記事のゴールはtensorflow-gpuでmnistを動かすことです。 今回試した環境 Ubuntu 18.04 NVIDIA GeForce GTX 1080 Ti nvidia-driver 390.48 CUDA 9.1(ホス…

リアルタイム音声変換メモ1

前回に引き続きリアルタイムに音声を変換するボコーダーをやってみます。 blog.ascreit.com かなりハマっていて、できる気配がないのでメモを残しながら試行錯誤してみようと思います。 前回、マイク入力をそのままスピーカーに流すことはできたのですが、py…

美少女声への道2

前回の続き blog.ascreit.com 結論から言うと、マイクから音声変換は未だできていません。 詳しい人教えてください! うまく行ってないコード audio_mic.py import pyworld as pw import numpy as np import pyaudio import time import queue import struct…

美少女声への道 1

前回、開発環境をDockerで作った blog.ascreit.com ので早速ボイスチェンジャーの作成に取り掛かろうと思います。 ピッチやメルケプストラムの抽出とかは難しすぎて訳わからないので、ライブラリを使わせて頂こうと思います。 まず aidiary.hatenablog.com …

声質変換 - 開発環境構築

前回の続き blog.ascreit.com ディレクトリ構造 voichan ├─ Dockerfile ├── README.md ├── SPTK-3.11.tar.gz └── python │ └── test.py └── docker-compose.yml ホスト環境 Docker version 18.03.1-ce docker-compose version 1.22.0-rc2 ホストOS:ubuntu:1…