KT 통신망, 전국 먹통…‘관리 오류’였다

2021.10.29 21:06 입력 2021.10.29 21:07 수정

과기정통부, 통신 대란 원인 발표

KT 통신망, 전국 먹통…‘관리 오류’였다

라우터 교체 중 명령어 ‘exit’ 누락, 협력사에만 작업 맡겨
오류 사전차단 시스템 없어…부실 관리·감독이 부른 인재

최근 발생한 KT발 ‘통신 대란’은 안전장치 없이 대규모 네트워크를 운영하고, 협력업체 직원에게만 교체 작업을 맡긴 통신업체의 부실한 관리에서 비롯됐다는 정부 조사 결과가 나왔다.

과학기술정보통신부는 지난 25일 발생한 KT 네트워크 장애 사고에 대한 원인 조사·분석 결과를 29일 발표했다.

과기정통부가 사고 기록을 분석한 결과에 따르면 이번 사고는 부산국사에서 기업 망 라우터를 교체하던 중 작업자가 설정을 잘못 입력해 발생했다. 해당 작업자가 프로토콜 명령어를 마무리하는 과정에서 ‘엑시트’(exit) 명령어를 누락했고, 이로 인해 내부 라우터 간 경로 정보를 주고받는 프로토콜(IS-IS)에 평소보다 수십배 많은 정보가 잘못 전송되면서 오류가 발생했다는 것이다.

부산지역에서 발생한 라우팅 오류가 전국으로 확산된 배경에는 KT의 부실한 관리가 큰 영향을 미쳤다. 과기정통부 조사 결과 KT 네트워크에 있는 라우터들을 연결하는 IS-IS는 잘못된 데이터 전달을 막는 안전장치 없이 전국이 하나로 연결돼 있었다. 이로 인해 부산지역 라우터의 잘못된 경로 업데이트가 다른 지역 라우터에도 적용돼 통신 장애가 전국으로 확산된 것이다. 과기정통부에 따르면 전체 라우터에 오류가 전파되기까지 걸린 시간은 30초가 채 걸리지 않았다.

통신 대란 당시 KT의 인터넷TV(IPTV)와 음성전화 서비스도 장애를 겪은 이유는 인터넷 서비스가 원활치 않자 문자 사용이 늘어났고, 스마트폰 등 단말기 전원을 리셋하는 이용자가 증가하면서 트래픽에 부하가 가중됐기 때문인 것으로 추정됐다.

당초 야간에 승인된 작업을 주간에 수행하고, 관리자 없이 협력업체 직원들만 작업에 투입하는 등 네트워크 관리상의 허점도 드러났다. 과기정통부는 교체 작업도 네트워크가 연결된 상태로 이뤄졌다고 밝혔다. 특히 KT는 네트워크가 차단된 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드를 확보하지 않았고, 지역에서 발생한 오류가 전국으로 확산하는 사고를 차단할 수 있는 시스템도 없었던 것으로 알려졌다.

과기정통부는 이번 조사 결과를 바탕으로 주요 통신사업자 네트워크의 안정성 확보 방안을 마련하기로 했다. 이를 위해 과기정통부 네트워크정책실장을 단장으로 네트워크 전문가들과 태스크포스(TF)를 꾸리기로 했다. 또 통신사업자의 네트워크 작업체계, 기술적 오류 확산 방지체계 등 네트워크 관리체계를 점검하고, 통신사업자가 네트워크 작업으로 인한 오류 여부를 사전에 진단할 수 있는 시뮬레이션 시스템을 도입할 계획이다.

KT도 이용자 피해 현황을 조사하고 피해구제 방안을 마련키로 했다. 이 밖에 방송통신위원회는 통신장애 발생 시 실효성 있는 피해구제를 위해 법령, 이용약관 등을 개선하는 방안을 검토할 예정이다.

추천기사

바로가기 링크 설명

화제의 추천 정보

    오늘의 인기 정보

      추천 이슈

      이 시각 포토 정보

      내 뉴스플리에 저장