실패할 학습데이터

2024.05.15 20:49 입력 2024.05.15 20:50 수정

미국 뉴욕시는 기업들이 인공지능(AI)을 채용에 활용할 경우 채용 결과가 성별이나 인종 등에서 편향되지 않았는지 여부를 평가해 매년 공개하는 규제를 2023년 7월 발표했다. 미국의 대기업 채용 AI 프로그램이 여성들에게 불리하게 작용한 사례가 있었기 때문이다. 채용 AI 프로그램을 개발했던 미국의 대기업은 결국 이를 폐기했다. AI를 학습시키는 과정에서 투입된 데이터들이 인간들이 지닌 성별·인종적 편향성을 가지고 있었고, AI는 투입된 데이터를 기반으로 패턴을 찾아가는 과정에서 인간의 편향성을 그대로 학습하게 된 것이다.

최근 AI 기술 경쟁의 주요 이슈는 ‘경량화’이다. 클라우드 기반의 대규모 AI 시스템이 아니라 개인의 컴퓨터나 노트북 심지어는 휴대폰에서조차 구동이 가능한 개인용 AI를 누가 빨리 만들어 낼 것인가를 놓고 수많은 기업들이 앞다투어 경쟁을 벌이고 있다. 따라서 대규모의 하드웨어를 필요로 하는 매개변수의 확대 경쟁보다는 누가 더 순수한 데이터를 많이 확보하고 학습시키느냐가 AI 개발에 중요한 요소로 떠오르고 있다.

한국 교육부는 세계 최초로 학습 데이터를 국가 단위에서 모으려 하고 있다. AI 디지털 교과서를 통해 대한민국 모든 학생들의 학습 데이터를 한곳에 모아서 공공 데이터를 생성하려 하고 있다. 이렇게 수집된 공공 데이터는 AI 디지털 교과서 개발사에 제공할 계획이다. AI 디지털 교과서 개발사는 많은 학습 데이터를 기반으로 좀 더 정교한 AI 디지털 교과서를 개발할 수 있게 되고, 그 결과 한국이 에듀테크 선도국가가 될 것으로 예상하고 있다. 매우 거창하고 호기로운 꿈이다. 그러나 불행하게도 그 꿈은 설계부터 잘못되었다. 우리가 수집한 공공 데이터는 매우 심각한 오류와 편향성을 가지고 있기 때문이다.

한국 특수교육 대상자는 2023년 기준으로 1.9%밖에 되지 않는다. 선진국 중 가장 낮은 비율이다. 선진국의 특수교육 대상자 중 가장 높은 비율을 차지하는 장애는 학습장애이다. 한국의 2023년 학습장애 학생은 1037명이다. 특수교육 대상자의 0.9%이다. 전체 학생의 0.02%만 학습장애 특수교육 대상자이다. 미국은 전체 학생의 3.6%를 학습장애로 진단하고 지원하고 있다.

학년 초 기초학습 부진으로 진단되고 특별보충을 통해 구제된 아이들이 그다음 해 진단에서 다시 기초학습 부진아로 진단되는 일들이 20년째 반복되고 있다. 기초학습 부진으로 진단받은 아이들 중 상당수는 학습장애일 가능성이 높다. 전문가가 아닌 일반 교사의 보충학습으로 치료가 가능한 아이들이 아니다. 특수교육이 필요한 아이들에게 기초학습 진단 보정 교육을 해왔기에 매해 같은 일이 반복되고 있는 것이다.

한국 인구의 14%가 느린학습자에 해당하는 ‘경계선 지능’인 것으로 추정된다. 여기에 포함되는 아이들에게도 학교가 적절한 지원을 해주지 못하고 있다. 많은 경우 느린학습자들을 게으른 학습자로 오해하여 진단하고 비난하기 쉽다.

약자를 배려하지 않고 경쟁에서 이기는 것만 중요하게 생각하는 우리 교육의 모순과 편향성이 그대로 공공 학습 데이터로 수집될 것이다. 이런 공공 학습 데이터로 개발된 AI는 느린학습자나 학습장애의 어려움을 겪고 있는 아이들에게 더 큰 절망감을 안겨줄 것이다. 잘못된 데이터로 개발된 우리 에듀테크 기술이 세계시장을 선도하기란 불가능하고 선도해서도 안 된다. 경쟁교육의 고통을 세계로 확산하는 꼴이 된다. 한국 특수교육 통계를 아는 국가에서는 우리의 학습용 AI를 신뢰하지 않을 것이다.

교육부는 학생들의 학습 데이터를 모으기 전에 제대로 된 진단을 통해 학습장애의 어려움을 겪고 있는 아이들을 진단하고 지원하는 일을 우선해야 한다. 경계선 지능으로 인해 학교 교육과정을 따라가지 못하는 아이들을 위한 교육과정을 개발하고 지원방안을 마련해야 한다. 그래야만 교육부가 목표로 세운 ‘모두를 위한 맞춤 교육’이 가능해진다.

홍인기 교육정책 비평가

홍인기 교육정책 비평가

추천기사

바로가기 링크 설명

화제의 추천 정보

    오늘의 인기 정보

      추천 이슈

      내 뉴스플리에 저장