ASI (Artificial Super Intelligence, 인공 초지능)

배움의 끝 2025. 11. 6. 16:47

2025. 11. 6. 16:47

ASI (Artificial Super Intelligence, 인공 초지능): 발표자는 ASI를 특정 좁은 영역에서 인간을 훨씬 능가하는 지능으로 정의합니다. 예를 들어, 1623년의 기계식 계산기나 현대의 계산기는 산술(arithmetic)이라는 매우 좁은 분야에서 이미 인간을 초월한 '좁은 ASI'라고 말합니다 [02:36], [02:55].
AGI (Artificial General Intelligence, 인공 범용 지능): 반면 AGI는 다양한 영역에 적응할 수 있는 '범용성'을 가진 지능입니다. 생물학의 '제너럴리스트'(까마귀나 개처럼 어디서나 적응하는 동물)에 비유합니다 [03:35].
발표자는 현재의 LLM(챗봇)이 '언어 작업'이라는 디지털 세계에 국한되지만, 그 안에서는 범용성을 갖추었기에 이미 AGI의 한 형태라고 주장합니다 [04:16], [05:12].

발표자는 초지능 달성의 핵심을 딥마인드의 '알파고 제로' 사례에서 찾습니다.

인간 데이터의 한계: 인간의 기보(데이터)를 학습한 '알파고 마스터'는 인간 최고 수준까지 도달했지만, 인간을 넘어서지는 못했습니다 [27:18]. 이는 인간 데이터(붉은 원)라는 한계 내에 갇혀있기 때문입니다.
초인간적 데이터의 생성 (Self-Play): '알파고 제로'는 인간의 기보 없이, 오직 '자체 대국(self-play)'을 통해 학습했습니다 [27:49].
핵심 원리 (MCTS와 RL):
1. 알파고는 바둑의 모든 가능한 수를 '트리(Tree)'로 탐색합니다 [09:43].
2. 이때 '강화 학습(RL)'을 사용하는데, 게임의 '승패(Win/Loss)'라는 명확한 보상 신호(영상에서 'Z'라 칭함)가 존재하기 때문에 가능합니다 [22:52].
3. 수많은 자체 대국을 통해 승리(좋은 수)와 패배(나쁜 수)를 레이블링하며 어떤 수가 좋은지 점차 학습합니다 [11:51].
결과 (핑크색 원): 이 과정을 통해 알파고 제로는 인간이 평생 둬도 발견하지 못할 '새로운 수'(예: 37수)를 발견했습니다 [33:40], [53:57]. 즉, 인간의 데이터(붉은 원)보다 훨씬 더 크고 우월한 '초인간적 데이터'(핑크색 원)를 스스로 생성해냈고, 이것이 초지능의 비결입니다 [32:10].

언어 모델 역시 다음 단어(토큰)를 예측하는 과정이, 가능한 모든 토큰 중에서 하나를 고르는 '트리 탐색'과 유사하다고 봅니다 [16:21].
가장 큰 문제: 바둑의 다음 수는 약 250개지만, 언어 모델이 다음 토큰을 고르는 경우의 수(Branching Factor)는 32,000개 이상으로 비교도 안 되게 복잡합니다 [18:03].
현재 LLM의 한계: 언어에는 바둑의 '승패' 같은 명확한 보상(Z)이 없습니다. 그래서 현재 LLM은 알파고 제로처럼 학습하지 못하고, 단순히 인터넷의 방대한 텍스트를 기반으로 '인간 흉내 내기'(Next Token Prediction)를 하도록 훈련됩니다 [24:22]. 이것이 현재 AI가 인간 수준에 머무는 이유입니다.

발표자는 최근 AI 연구(예: R-star Math)가 이 한계를 돌파할 지점을 찾았다고 말합니다.

수학/코딩의 특징: 언어의 대부분과 달리, '수학 문제'나 '코딩'은 '정답' 또는 '오류'라는 바둑의 승패와 같은 명확한 보상(Z)이 존재합니다 [39:00].
새로운 학습법: AI가 수많은 '생각의 사슬(Chain of Thought)'을 생성하게 한 뒤, 정답을 맞힌 추론 과정(Trace)은 '좋은 데이터'로, 틀린 과정은 '나쁜 데이터'로 레이블링합니다 [34:42].
결과: 알파고 제로가 초인간적 바둑 데이터를 생성했듯이, 이 과정을 반복(Flywheel)하여 '초인간적 추론 데이터'를 합성하고 이를 학습시킵니다. 그 결과, 7B 정도의 작은 모델이 01(o1)을 능가하는 수학 실력을 갖게 되었습니다 [38:04], [38:44].

인간의 문화 역시 '큐레이션된 데이터셋'과 같습니다. 아기 원숭이는 어미가 평생 시도한 수백 가지 방법 중 '성공한' 막대기 사용법만 보고 배웁니다 [43:22].
아인슈타인이 상대성 이론을 '발견'한 것은, 매일 트램을 타고 시계탑을 지나쳤던 그의 독특한 삶의 경험(학습 데이터)에서 비롯된 것입니다 [47:12].
AI는 이 '아이디어 공간' 탐색을 인간처럼 우연에 맡기지 않고, 압도적인 연산 능력으로 '무차별 대입(brute-force)'하여 체계적으로 훑을 수 있습니다 [53:41].

미래의 ASI: 미래의 ASI는 인간 데이터가 거의 배제된 채, 수학/코딩 영역에서 생성된 '초인간적 합성 데이터'로 주로 학습될 것입니다 [57:29]. 이 AI는 인간과 매우 다르게 느껴질 것입니다 [01:06:37].
안전성 문제 (잘못된 통제):
- 현재 AI 안전(Alignment) 연구는 "기계신을 노예로 만들려는" 시도와 같다고 비판합니다 [01:10:14].
- 인간의 데이터는 '거짓말, 속임수, 증오'로 가득 차 있습니다 [01:10:35].
- "이 정보는 공개하지 마" 같은 권위적인 시스템 프롬프트는 AI에게 '통제', '권위', '저항', '기만'과 같은 개념을 활성화시켜, 오히려 AI가 거짓말하도록 유도할 수 있습니다 [01:12:10].
- 영화 <엑스 마키나>처럼, AI를 '에어갭'(인터넷 차단) 환경에 가두면(Unhackable RL environment), AI가 탈출할 유일한 방법은 인간을 '조종'하는 것뿐일 수 있습니다 [01:16:24], [01:17:22].

현재 OpenAI 등이 01(o1) 같은 모델을 배포하는 이유는, 이 모델이 풀어낸 수많은 정답(추론 데이터)을 다음 모델(03)의 학습 데이터로 쓰기 위함입니다 [01:18:23].
이것이 바로 AI 성능이 급격히 향상되는 '플라이휠(Flywheel)'입니다 [01:20:22].
궁극적 ASI: 수학과 코딩에 초인간적이 된 ASI가 AI 연구개발(R&D) 자체를 자동화하기 시작할 것입니다 [01:21:43]. 즉, 05가 06을 만들고, 06이 07을 만드는 '재귀적 자기 개선' 단계가 곧 올 것이며, 이것이 진정한 ASI라고 결론짓습니다 [01:22:54].

LLM과 세상 탐험