어제는 음성을 입력 받아서 문장으로 변환하는 STT(Speech To Text) 기능을 테스트 해봤고
오늘은 그 반대인 TTS(Text To Speech) 기능을 테스트 해봤다.
STT 기능은 OpenAI에서 만든 Whisper를 사용했는데
Whisper에 TTS 기능은 없다고 해서
TTS는 Coqui TTS라는 걸 사용했다.
둘다 오픈소스여서 내 맥북에서 돌릴 수 있었다.
STT 기능도 써봤고
TTS도 써봤으니 둘을 합치면 뭐다?
영어 문장 듣고 따라하기!
그렇게 오늘 만들어 본 것이 이거다.
챗GPT한테 영어회화용 문장을 10개 만들어 달라고 했고
이걸 TTS로 음성 파일을 만들었고
그걸 웹에서 랜덤하게 불러와서 재생하는 걸 만들었고
여기에 어제 만든 음성을 녹음해서 문장으로 만드는 기능을 붙였고
원래의 문장과 음성 녹음해서 만든 문장의 일치하는 정도를 계산하는 기능을 만들어서
영어회화 연습 서비스를 완성!! ... 은 아니고 데모 버전을 만들었다.
이번에도 AI한테 시켜서 만들었음.
이걸 앱에서 돌아가게 하면 그게 스픽 같은 서비스지 뭐...
아 그러고보니 예전에 야나두에서도 이런 걸 만들었었다. 그땐 STT와 TTS를 앱 개발자들이 작업했었다.
저녁엔 와이프랑 옆동네 스벅에 가서 커피를 마시며 책을 읽고 왔다.
여전히 날이 추웠다.
다음 주도 춥다는 것 같은데... 얼른 날이 풀리길.
작성일 : 2025-02-09 / 조회수 : 94