1.물체소리 학습 모델 생성
배경 소음 수집
클래스 추가
소요 시간 10초로 지정 후 데이터 수집
수집 완료 후 [학습 시키기] 클릭
학습 완료!
2.음성인식 성능 평가
고급 설정에 들어가면 성능을 수치로 확인할 수 있다
어휘 설명
test acc(학습 샘플) : 추출해 놓은 데이터셋의 85%를 학습에 사용한다
=트레이닝 샘플, 트레이닝 데이터셋
acc(테스트 샘플) : 모아놓은 데이터셋의 15% 가량으로 가중치 업데이트마다 성능을 평가하기 위한 데이터로 사용되는 테스트 데이터셋
과소적합 : 인공지능 모델이 학습 샘플의 어떠한 특징이나 복잡성을 파악하지 못하여 분류 상태가 좋지 않은 경우
=> 훈련 샘플(훈련 데이터셋)과 테스트 데이터셋에 대한 성능 모두 안 좋은 경우
과적합 : 인공지능 모델이 지나치게 학습 샘플과 유사하게 분류하도록 학습이 되어서 테스트 샘플에 대해서는 성능이 좋지 못한 경우
=>테스트 데이터셋에 대해서는 지속적으로 성능이 좋아지지 않지만 훈련 데이터셋에서는 아주 성능이 좋은 상태
=>아무리 에포크를 늘려도 계속 과적합 상태가 유지된다
=>과적합 상태를 극복하려면?
데이터셋의 구성을 더 다양하게 진행하여 전체 데이터셋을 85%, 15%로 나누어도 비슷한 데이터 샘플끼리 섞을 수 있도로 갇양하 ㄴ데이터와 많은 양의 데이터를 모아야한다
최종적으로는 훈련 데이터셋에 대한 손실 및 정확도 그래프와
테스트 데이터셋에 대한 손실 및 정확도 그래프가
서로 비슷한 범주에서 좋게 나오도록 데이터를 모으고 학습시켜야한다
(과적합X, 과소적합X)
정리
성능 향상시키는 방법
1. 배경 소음 데이터 확보하기
2. 데이터 수집량 늘리기
3. 데이터 특징이 잘 드러나도록 정제하기
성능을 평가할 수 있는 방법
1. 정확도 함수 그래프
2. 손실 함수 그래프
'LG CNS AI GENIUS > 강의 정리본' 카테고리의 다른 글
[AI 미션클리어] 11차시 – 인공지능을 통한 음성인식 기초 (0) | 2022.06.09 |
---|---|
[AI 미션클리어] 10차시 – 인공지능과 음성인식 (0) | 2022.06.08 |
[AI 미션클리어] 9차시 – 음성 데이터의 이해 (1) | 2022.06.07 |
[AI 미션클리어] 8차시 – Teachable Machine으로 물체 구분하는 모델 만들기 (0) | 2022.05.18 |
[AI 미션클리어] 7차시 – Teachable Machine 시작하기 (0) | 2022.05.15 |