개념

Big Data는 매우 크고 다양하며 빠르게 생성되는 데이터이다. 현대 인공지능은 많은 데이터를 통해 패턴을 학습하기 때문에 Big Data는 AI 발전의 중요한 조건이다.

AI와의 관계

기계학습은 사람이 모든 규칙을 직접 코딩하지 않고 데이터에서 규칙을 배운다. 따라서 학습 데이터가 많고 다양할수록 모델은 더 많은 패턴을 경험할 수 있다.

이미지 데이터, 텍스트, 음성, 번역 데이터, 사용자 행동 로그는 모두 AI 학습에 쓰일 수 있다. LLM은 방대한 텍스트를 통해 언어 패턴과 지식 구조를 학습한다.

주의점

데이터가 많다고 항상 좋은 것은 아니다. 데이터가 편향되어 있으면 AI 윤리 문제가 생기고, 실제 환경과 다르면 일반화 성능이 떨어질 수 있다.