470 likes | 1k Views
뉴로 컴퓨터 개론. 제 14 장. 제 14 장 뉴로 컴퓨터 응용. 차례. 14.1 음성 합성 14.2 음성 인식 14.3 문자 인식 14.4 영상 처리 14.5 무인 자동차 주행 14.6 로봇 제어 14.7 의료 진단 시스템. 음성 합성. 음성 합성. NETtalk. T. Sejnowski & C. Rosenberg 영어 문장을 입력하여 음소들로 변환. 음성 합성. NETtalk 신경망 구조. 음성 합성. NETtalk 신경망. 입력층
E N D
뉴로 컴퓨터 개론 제 14 장
차례 14.1 음성 합성 14.2 음성 인식 14.3 문자 인식 14.4 영상 처리 14.5 무인 자동차 주행 14.6 로봇 제어 14.7 의료 진단 시스템
음성 합성 NETtalk T. Sejnowski &C. Rosenberg 영어 문장을 입력하여 음소들로 변환
음성 합성 NETtalk 신경망 구조
음성 합성 NETtalk 신경망 • 입력층 인접한 7개 문자 입력 위해 7개 그룹 • 각 그룹은 알파벳과 구두점 표현하기 위해 29개 뉴런 • 전체 203개 뉴런 • 은닉층 학습효율을 고려하여 80개 뉴런 • 출력층 음소와 강세등을 표현하기 위해 26개 뉴런
음성 합성 NETtalk 성능 • 연결 강도 임의의 작은 값(-0.3∼+0.3)으로 초기화 • BP알고리즘 • 학습 패턴 웹스터 포켓 사전에서 1,000개 단어 선택 • 95% 정확도
음성 인식 음성 타자기 T. Kohonen 입력한 음성을 인식하여 상응하는 문자 출력
음성 인식 포노토픽 맵 형성을 위한 신경망 구조
음성 인식 포노토픽 맵 신경망 • 입력층 음성 신호 15개스펙트럼으로 분해하여 입력 15개 뉴런 • 출력층 96개 뉴런
음성 인식 포노토픽 맵
음성 인식 포노토픽 맵의 반응 시퀀스 • 음성 파형 분석시간9.83ms
음성 인식 음성 타자기 성능 • 자율 학습법(SOM) • k, p, t음소의 명확성 떨어짐 • 92%∼97% 인식률
문자 인식 우편번호 인식 시스템 T. LeCun 필기체 숫자의 우편번호 인식
문자 인식 필기체 숫자 인식 신경망 구조
문자 인식 필기체 숫자 인식 신경망 • 입력층 한 숫자를 정규화한 16×16 그레이 영상 입력 256개 뉴런 • 은닉층 3계층으로 구성 각각 768개, 192개, 30개 뉴런 • 출력층 0∼9의 숫자를 표현하기 위해 10개 뉴런
문자 인식 우편번호 인식 시스템 성능 • BP알고리즘 • 학습 패턴 손으로 쓴 7,291개 우편번호 • 학습에 사용된 패턴0.14% 오인식 • 일반 패턴5% 오류
영상 처리 SexNet B. Golomb &T. Sejnowski 사람 얼굴을 입력하여 남녀의 성별을 판별
영상 처리 전처리 • 512×512얼굴 영상 • 눈을 수평하게 위치 • 두 눈의 간격12개화소 • 눈과 입의 간격8개화소 • 전체30×30영상 축출
영상 처리 영상 압축 • 전처리한 영상을40개화소로 압축하기 위해 영상 압축 신경망에 입력 • 영상을 영상 압축 신경망에 입력하여 • 동일한 영상이 출력되도록 학습
영상 처리 영상 인식 • 영상을 영상 압축신경망에 입력하여 은닉층의 출력 얻고 이를 영상 인식 신경망의입력으로 사용 • 영상 인식 신경망은 남녀 식별
영상 처리 영상 압축 신경망 구조
영상 처리 영상 압축 신경망 • 입력층 전처리된 30×30영상 입력 900개 뉴런 • 은닉층 40개 뉴런 • 출력층 900개 뉴런
영상 처리 영상 인식 신경망 구조
영상 처리 영상 인식 신경망 • 입력층 압축 영상입력 위해40개 뉴런 • 은닉층 40개 뉴런 • 출력층 남녀식별 위해1개 뉴런
영상 처리 SexNet 성능 • BP알고리즘 • 학습 패턴 남녀 각각 45명씩 90명의 사진 • 89% 남녀 인식률
영상 처리 영상 복원 시스템 Y. Zhou &R. Chellappa 손상된 영상을 Hopfield모델을 이용하여 복원
원래의 영상손상된 영상 가역 필터신경망 영상 처리 손상된 영상 복원
무인 자동차 주행 ALVINN 무인 주행 시스템 D. Pomerleau 도로 영상을 입력 받아 자동차가 자동 주행할 수 있도록 핸들을 조작하는 시스템
무인 자동차 주행 ALVINN 신경망 구조
무인 자동차 주행 ALVINN 신경망 • 입력층 도로 상황을 촬영한영상 정보/거리 정보/명암 정보 1,217개 뉴런 • 은닉층 29개 뉴런 • 출력층 핸들조작을 위해46개 뉴런
무인 자동차 주행 ALVINN 성능 • BP알고리즘 • 학습 패턴 1,200개 도로 영상 • ALVIN시스템을 장착한 자동차로 도로에서무인 시험 주행 성공
로봇 제어 이동식 로봇 S. Nagata 빛 센서, 초음파 센서 등의 센서를 통해 외부 자극을 입력받아 전후진, 좌우회전, 경보음 등으로 반응하는 이동식 소형 로봇
로봇 제어 이동 로봇 제어 신경망 구조
로봇 제어 이동 로봇 제어 신경망 • 이성망 입력층 13개 뉴런 은닉층 9개 뉴런 출력층7개 뉴런 로봇의 반응 본능망에의 흥분 및 억제 신호 입력 • 본능망 입력층/은닉층/출력층 각각5개 뉴런
로봇 제어 이동 로봇 제어 성능 • BP 알고리즘 • 로봇 제어에의 활용 가능성 입증
의료 진단 시스템 DESKNET Y. Yoon & L. Peterson 의대생 교육용 피부병 진단 시스템
의료 진단 시스템 DESKNET 신경망 구조
의료 진단 시스템 DESKNET 신경망 • 입력층 피부병징후와임상 자료96가지 96개 뉴런 • 은닉층 20개 뉴런 • 출력층 건선, 백선 등10가지 피부병진단 10개 뉴런
의료 진단 시스템 DESKNET 성능 • BP알고리즘 • 학습 패턴 환자 250명 자료 • 환자 99명 대상 실험 • 건선 정확도 30% • 나머지 병 정확도 70%∼80%