3. 데이터의 중요성과 인공지능
우리가 스마트폰으로 업로드한 사진, 동영상들은 네트워크를 통해 인터넷으로 흘러가며 다양한 네트워크 장비를 거쳐 데이터 센터에 저장된다. 데이터는 인공지능 시대에 중요한 자원이다.
- 데이터는 인공지능을 만드는 재료이기 때문이다.
- 기계학습 기법에 쓰이는 학습재료가 데이터이다.
전통적 인공지능인 지식기반 인공지능은 인간의 지식을 흉내내어 만들었으며 인간의 모든 지식을 규칙화하기 어렵다는 한계를 지닌다. 최근의 인공지능인 데이터 기반 인공지능은 인간의 학습을 흉내내어 만들며 적절한 데이터를 더 많이 줄수록 더 신뢰성 있는 규칙을 찾는다.
데이터 기반 인공지능은 다양한 분야에서 개발 및 서비스 되고 있다.
요즘 서비스되고 있는 인공지능의 기술 대부분이 데이터 기반 인공지능이다.
데이터는 형태에 따라 정형데이터, 비정형 데이터로 나눌 수 있다.
정형데이터는
엑셀처럼 구조화 되어있는 테이블 형태의 데이터이다. 데이터의 특징 속에서 의미를 추출하여 새로운 데이터 값을 예측, 분류할 수 있다.
비정형 데이터는
정해진 형식이 없는 이미지 데이터, 음성 데이터, 텍스트 데이터 등이 있다.
빅데이터란
디지털 환경에서 생성되는 데이터로 그 규모가 방대하고 생성 주기도 짧으며 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다.
딥러닝 기술의 발전에 따라 비정형 데이터를 포함한 빅데이터를 활용하여 인공지능 모델 제작이 가능해졌다.
비정형 데이터 유형에 따른 제작 가능한 인공지능은 이미지 데이터를 이용한 이미지 인식/생성 기술을 통한 자율주행자동차 신호등 및 교통 표지판 인식, 나만의 손글씨 폰트 만들기 등이 있다.
음성데이터는 음성 인식/합성기술을 통한 음성인식 스피커, 음성인식 회의록 작성 등에 사용된다.
텍스트 데이터는 자연어처리기술의 주재료로 사용되며 뉴스 요약, 뉴스 기사 작성, 번역 인공지능 등으로 사용될 수 있다.
자율주행 자동차에는 주변상황을 예측하고 최적의 경로를 생성하는 데, 또한 자율주행용 지도의 지도 속 위치 파악하는 데에도 인공지능 기술이 사용된다.
국내외 기업들이 기업경쟁력을 위해 데이터 센터를 구축하고 있으며 데이터의 중요성이 높아짐에 따라 데이터 주권 또한 중요해지고 있다.
'AI > 인공지능' 카테고리의 다른 글
5. 인공지능과 학습 – 지도학습, 비지도학습, 강화학습 (0) | 2022.01.22 |
---|---|
4. 인공지능과 다양한 기술 이야기 (0) | 2022.01.22 |
2. 생활 속 인공지능 (0) | 2022.01.22 |
1. 인공지능이란 무엇인가? (0) | 2022.01.22 |
인공지능 (0) | 2021.02.14 |