본문 바로가기

LG CNS AI GENIUS/강의 정리본

[AI 미션클리어] 11차시 – 인공지능을 통한 음성인식 기초

Teachable machine 오디오 프로젝트 사용 방법

1.티쳐블 머신 초기진입

음성인식 실습을 해볼 것이기 때문에 오디오 프로젝트 선택

2.티쳐블 머신 메인학습

예제: <한글 음절을 인식하는 모델 만들기>

음절 중에서 '가, 나 , 다, 라'를 인식할 수 있는 모델을 만들어보자

*배경 소음 class : 오디오 모델을 만들때 굉장히 필수적으로 존재하는 부분

백색 소음이나 녹음 시 주변 소음들이 낄 수 있어서 아무 것도 말하지 않을때의 배경 소음 또한 학습에 반영하는 것이다

=>20초 이상의 샘플 데이터를 필수적으로 추가해야함

 

데이터 수집 준비

마이크 버튼을 누르고 마이크를 사용하면 된다

톱니바퀴 아이콘을 누르면

타이머처럼 버튼을 누른 뒤 녹화되기까지의 지연시간과 그 이후 녹화되는 소요 시간을 각자에게 맞게 설정할 수 있다

배경 소음 데이터 수집 

배경 소음은 아무 말도 하지 않고 수집하면 된다

수집 후 [샘플 추출]을 누르면 일정 간격으로 나누어서 샘플을 추출해낸다

가~라 데이터 수집 

'가'부터 '라'까지 클래스부터 만들어주자

데이터를 수집할때 하나의 클래스에 모아진 데이터들의 시간의 합이 최소 10초는 되도록 데이터를 수집해야한다

모델 학습시키기

[모델 학습시키기] 클릭

고급에서 에포크를 바꿀 수 있지만 일단 기본값으로 학습시켜보자

 

모델의 학습이 끝나면 미리보기가 보이게 된다

 

소리가 입력되는 상태를 보여주는 것

 

중첩 요인: 만들어진 모델로 오디오 데이터를 테스트하는 빈도

0    => 1초마다 테스트

0.5 => 0.5초마다 테스트

 

아주 짧게 내는 소리마다 구분해서 나타내고 싶다면 빈도를 빠르게 설정해주면 된다

 

정확도를 보고 부족한 부분은 데이터를 더 추가해 학습시켜주면 된다!