LG CNS AI GENIUS/강의 정리본 (12) 썸네일형 리스트형 [AI 미션클리어] 12차시 – 인공지능을 통한 음성인식 심화 1.물체소리 학습 모델 생성 배경 소음 수집 클래스 추가 소요 시간 10초로 지정 후 데이터 수집 수집 완료 후 [학습 시키기] 클릭 학습 완료! 2.음성인식 성능 평가 고급 설정에 들어가면 성능을 수치로 확인할 수 있다 어휘 설명 test acc(학습 샘플) : 추출해 놓은 데이터셋의 85%를 학습에 사용한다 =트레이닝 샘플, 트레이닝 데이터셋 acc(테스트 샘플) : 모아놓은 데이터셋의 15% 가량으로 가중치 업데이트마다 성능을 평가하기 위한 데이터로 사용되는 테스트 데이터셋 과소적합 : 인공지능 모델이 학습 샘플의 어떠한 특징이나 복잡성을 파악하지 못하여 분류 상태가 좋지 않은 경우 => 훈련 샘플(훈련 데이터셋)과 테스트 데이터셋에 대한 성능 모두 안 좋은 경우 과적합 : 인공지능 모델이 지나치게.. [AI 미션클리어] 11차시 – 인공지능을 통한 음성인식 기초 Teachable machine 오디오 프로젝트 사용 방법 1.티쳐블 머신 초기진입 음성인식 실습을 해볼 것이기 때문에 오디오 프로젝트 선택 2.티쳐블 머신 메인학습 예제: 음절 중에서 '가, 나 , 다, 라'를 인식할 수 있는 모델을 만들어보자 *배경 소음 class : 오디오 모델을 만들때 굉장히 필수적으로 존재하는 부분 백색 소음이나 녹음 시 주변 소음들이 낄 수 있어서 아무 것도 말하지 않을때의 배경 소음 또한 학습에 반영하는 것이다 =>20초 이상의 샘플 데이터를 필수적으로 추가해야함 데이터 수집 준비 마이크 버튼을 누르고 마이크를 사용하면 된다 톱니바퀴 아이콘을 누르면 타이머처럼 버튼을 누른 뒤 녹화되기까지의 지연시간과 그 이후 녹화되는 소요 시간을 각자에게 맞게 설정할 수 있다 배경 소음 데.. [AI 미션클리어] 10차시 – 인공지능과 음성인식 1.음성인식이란? 음성인식: 기계가 사람의 말소리를 인식하고 그 결과를 문자로 출력해주는 시스템 ex) 나 지금 친구랑 저녁 먹으러 왔어 => 기계:음성 분석, 인식 => 음성 인식의 결과를 문자 언어로 바꿈 2.음향모델과 음향모델훈련 음향 모델: 음성에 대해 익숙해지는 과정 음향 모델 또는 Acoustic Model을 훈련한다고 하며 음향 모델을 훈련하는 것은 특정 언어에 존재하는 모든 음소를 배우는 과정을 담고 있다 3.언어모델과 언어모델훈련 음성을 인식할 언어에 익숙해졌다면? 단어들을 자연스럽게 나열하는 규칙을 배워야한다 단어의 자연스러운 나열: 특정 단어 다음에 나타나는 단어가 의미상으로나 문법상으로 어색하지 않은 상태 단어의 자연스러운 결합을 듣고 배우는 과정을 음성인식에서는 언어모델 또는 La.. [AI 미션클리어] 9차시 – 음성 데이터의 이해 1.언어의 종류 음성 인식: 우리의 말들을 인지, 파악하고 분석해서 그 결과에 맞는 표현이나 결과를 전달함 그렇다면 기계는 언어를 이해하는 것일까 소리를 이해하는 것일까? 자연어: 인간의 언어 문자언어: 시각 => 컴퓨터에게 전달할 때 이미지 사용O 음성언어: 청각 => 소리로 전달해야하기 때문에 어렵다 (음성 데이터) 기계어: 기계가 사용하는 언어 ㄴ기계는 전기 신호를 사용하고 기계과 인간의 소통은 인간에서부터 출발했기 때문 >어셈블리어 : 기계는 0과 1만 이해하기 때문에 인간이 이해하기 어려워 탄생한 언어 >고급 프로그래밍 언어, 고급어 : 어셈블리어에서 더 발전한 언어 ex) C, java, python 2.음성 데이터의 개념 소리는 어떠한 매질을 타고 전달이 된다. 공기의 주기적인 진동 즉 앞뒤.. [AI 미션클리어] 8차시 – Teachable Machine으로 물체 구분하는 모델 만들기 1.데이터 수집 실습 각도와 카메라의 거리를 다양하게 하여 약 180개 정도의 이미지 데이터를 수집했습니다. 2.모델 학습시키기 에포크 50, 배치 크기 16으로 모델을 학습시켰습니다 에포크 2로 모델을 학습시켰을때의 에포크별 정확도와 손실입니다. 3.test loss와 loss 고급 설정의 어휘를 보면 학슴 샘플과 테스트 샘플을 확인할 수 있다. 학습 샘플은 지난 시간에 배운 트레이닝셋, 테스트샘플은 테스트셋이다. 트레이닝 셋으로 학습을 시키고 그 다음에 라벨이 붙지 않은 걸 가지고 테스트한다. 내가 모은 교과서, 필통, 파우치의 이미지 샘플들이 트레이닝 셋과 테스트 셋으로 나뉘는 것이다. 교과서 이미지 샘플의 182개 중 85%는 트레이닝 셋, 15%는 테스트 셋이 되는 것이다. 필통과 파우치 샘플도.. [AI 미션클리어] 7차시 – Teachable Machine 시작하기 1.Teachabel Machine 소개 https://teachablemachine.withgoogle.com/ Teachable Machine Train a computer to recognize your own images, sounds, & poses. A fast, easy way to create machine learning models for your sites, apps, and more – no expertise or coding required. teachablemachine.withgoogle.com teachable machine 웹서비스 접속 teachable machine을 활용하면 누구나 기계학습 코드를 작성할 필요없이 기계학습 모델을 더 쉽게 만들 수 있다 우리가 모델을 저.. [AI 미션클리어] 6차시 – 영상처리와 인공지능 영상 인식이란? 영상(이미지 데이터)를 가지고 이미지 처리를 하거나 인공지능을 거쳐서 영상에 포함된 의미를 분석, 해석해 내는 과정 영상인식 작업의 종류 5가지 컴퓨터를 사용해서 영상을 처리(이미지 처리)를 연구하는 분야인 컴퓨터 비전이라는 큰 범주 안에 속해 있다 1.객체 탐지: 어떠한 객체, 즉 오브젝트가 존재하는지에 대한 유무를 판단 ㄴ알고리즘: 하고자 하는 객체의 특징을 사전에 추출하고 주어진 영상에서 해당 특징을 검출해내는 접근을 사용 ex) 빨간색 토마토를 검출해내고 싶을때, 빨갛고 동글다는 특징을 사전에 입력해둔다. 컴퓨터는 자기가 구분해낸 것이 빨간 토마토라는 것을 모른다. 그냥 특징에 맞춰서 객체를 구분해낸 것일뿐이다 =>정해진 특징에 맞는 '어떤 객체'이다 2.객체 인식: 그 객체의 자.. [AI 미션클리어] 5차시- 이미지 데이터의 이해 (pixel/frame/resolution) 이미지 데이터란? 오감 중 시각에 대한 의존도가 매우 높다. 정보 80% 이상이 시각을 통해 얻어진다. 영상처리란 카메라는 시각적 정보를 기록하기 위해 만들어진 것이다. 기록된 시각적 정보를 통해 그 정보를 해석하고 판단하여 정보를 처리하는 것을 바로 영상처리(Image processing)라고 한다. 근데 왜 영상을 이미지라고 하는 것일까? 사전적 의미의 영상 또는 이미지는 2차원 평면 위에 그려진 시각적 표현들이기 때문이다. 원래 영상은 정지된 영상, 움직이는 영상으로 나뉘어지는데 요즘 영상을 그냥 동영상으로만 생각하고 있기 때문이다. 정지된 영상은 사진, 움직이는 영상은 동영상으로 영상은 사진과 동영상을 표현하는 단어이다. 실제시간이 연속적으로 흐를 때 일정한 시간 간격을 시간의 변화량, 즉 델타t.. 이전 1 2 다음