top of page
작성자 사진Jay K. Yi

무위에 그친 인공지능 정부과제 참여

20여 년 만에 정부 연구과제에 참여하기 위해 #주관연구기관의 #연구책임자로서 사업 수행계획서와 발표용 파워포인트를 작성하여 제출하였다. 과 그 정통부 산하 #지능정보원에서 전담하는 #인공지능 학습용 데이터 구축 지원 사업이다. 연구과제 라기보다는 인공지능 학습용 데이터를 구축하고 이를 개방하여 관련 산업의 지능화를 촉진하고 아울러 코로나로 어려운 시기에 일자리를 창출하기 위한 일종의 용역 사업 성격이 강했다. 유사한 사업 공고가 상반기에도 있었다는데 관련 현황을 들어 보니 이번 “차량 과실비 평가를 위한 차량 사고 영상 및 이미지 데이터”에는 지원해 보는 것도 괜찮겠다는 생각이 들었다. 물론 우리가 주력으로 하거나 특화된 기술력을 제시하기에는 아직 부족한 분야이다. 그러나 향후 비파괴검사의 자동화를 위해 인공지능 #알고리즘을 이용한 #결함 탐지 및 #평가 기술은 필수적이므로 관련 동향 파악과 새로운 사업을 탐색하는 차원에서 추진하였다.


국내에서 1년 동안 약 300만 건 이상의 자동차 사고가 발생된다. 그중 약 20%가 상호 분쟁으로 발전되어 과실비율 판정이 필요하다고 한다. 경찰청 및 법원에서 사고 과실 평가를 위한 시뮬레이션 프로그램을 활용하고 있다. 그러나 그 결과 도출에 많은 시간이 걸리므로 인공지능 학습 데이터를 구축하여 이에 대응할 수 있는 체계를 구축하겠다는 것이 과제 요구서(RFP)의 목적이었다. 인공지능은 데이터를 바탕으로 확률을 구해 최적의 선택을 하는 알고리즘으로 구성되므로, 교통사고 #과실비 자동 산정을 위해서는 충분한 사고 이미지 확보가 선행 요소이다. 즉, 20,000건의 사고 사례에 대해 총 300만 장의 #정제작업을 거친 이미지 데이터를 확보하고 각각의 이미지에는 전문가의 의견과 판단을 거친 설명문을 삽입하는 #어노테이션 (#Annotation) 작업이 필요했다. 이렇게 확보한 이미지 데이터를 이용하여 자체 개발한 인공지능 알고리즘으로 자동차 사고 과실 비율을 최종적으로 제시할 수 있어야 했다.


IMF 직후에 이직했던 연구소에서 해외 유학을 다녀온 연구원이 #신경회로망 (#Neural Network)을 주제로 한 박사학위 논문을 발표한 적이 있었다. 잘 아는 분야는 아니었지만 “어떻게 저 방대한 계산을 수행할 수 있을까” 하며 회의적 시선으로 들은 기억이 있다. 세월이 지나는 사이에 #빅데이터 시스템이나 #머신러닝 등 관련 알고리즘, 그리고 이를 처리하는 하드웨어가 급속도로 발전했으므로 이제는 더 이상 계산량이나 시간이 장애가 되지는 않는 것 같다. 이미 문자 인식은 옛일이 되어 버렸고 10여 년 전부터 해외 유명 포탈 기업에서는 영상 인식도 처리해 왔었다. 약 5년 전에 있었던 바둑 기사 이세돌 9단과 구글의 인공지능 시스템인 #알파고 (#AlphaGo)의 세기의 대결을 통해 가공할만한 인공지능의 수준도 확인할 수 있었다. 이제는 주행 중인 차량이 주변 사물을 인식하여 스스로 운행하는 #자율주행차의 도입도 눈앞에 와 있는 시대에 살고 있다.


인공지능 자동인식에 필요한 학습을 위해서는 관련 분야의 문자, 소리, 영상 등의 방대한 데이터 확보가 기본이다. 이러한 데이터의 수집과 정제 및 가공과 같은 비교적 단순한 업무가 인공지능 개발 관련 소요 시간의 80% 이상을 차지한다고 한다. 국내외 여러 사이트에는 인공지능을 실생활에 응용할 수 있도록 다양한 분야의 각종 데이터를 이미 제공하고 있다. 33만 장 이상의 이미지를 보유한 공개 데이터 세트인 Common Object in Context (https://cocodataset.org/#home), 미국에서 자율 주행 개발 연구에 가장 널리 활용된다는 KITTI (http://www.cvlibs.net/datasets/kitti/), 머신러닝을 지원하기 위해 약 250,000대의 차량 이미지와 동영상 데이터 세트를 가진 lionbridge (https://www.lionbridge.com/), 차량에 대한 각종 이미지를 제공하는 Stanford 대학 사이트 (https://ai.stanford.edu/~jkrause/cars/car_dataset.html) 등을 예로 들 수 있다. 국내에도 #한국지능정보사회진흥원이 운영하는 AI Hub (홈 | AI 허브 (aihub.or.kr))에서 다양한 분야에 대한 각종 데이터를 구축하여 공개하고 있고, 주기적으로 이들 축적된 데이터를 활용하는 경진대회가 개최되고 있다.


인공지능 학습용 데이터 구축 과제에서 고차원 기술 개발 부분은 “인공지능 알고리즘 개발 및 적용” 부분에 국한된다고 할 수 있다. 즉, 차량 사고 이미지 데이터의 확보, 정제, 가공과 각각의 단계에서 엄격한 품질관리 도구 및 절차가 우선적 역량으로 요구된다고 할 수 있다. 특히 6개월도 채 되지 않는 사업 기간에 130여 명 이상의 인원이 투입되어야 하고 그중 상당수 인력은 개인사업자 신분의 프리랜서인 #crowd worker를 활용해야 했기에 사업 관리의 중요성이 과제 성패를 좌우할 것으로 판단했다. 어쨌든 우연한 기회에 관련 과제 정보를 입수하여 뒤늦게 참여를 결정했기에 차량 사고 이미지 데이터의 #수집, #가공#정제, #품질관리, 인공지능 알고리즘 개발 등 각 분야를 전담할 전문 회사나 연구용역을 수행할 전문가를 찾아서 급하게 #컨소시엄을 구성하였다. 일주일가량의 기간 동안 일사불란하게 협업하여 과제 수행 계획서, 데이터 구축 계획서, 데이터 품질관리 계획서, 발표용 파워포인트 등을 작성하여 just in time으로 제출할 수 있었다.


과제 특성이 상당한 labor가 투입되는 데이터 수집 및 가공, 품질, crowd worker 활용, 그리고 다양한 분야의 컨소시엄사를 leading 하는 프로젝트 관리력이 중요하였으므로 #중년의 나이이지만 과제 책임자를 맡을 수밖에 없었다. 미래를 대비하는 인공지능 연구라는 사업에 혹시 연구책임자의 나이나 이력이 부정적으로 작용하지 않을까 내심 우려가 되기도 했다. 생각해 보니 정부과제의 연구책임자로 직접 발표했던 기억은 90년대 후반의 환경부 G7 과제가 마지막이었다. 그 이후는 사내 과제나 혹은 최고 경영진 대상 경영회의에서 직접 발표하는 것 이외에는 주로 듣거나 평가자의 입장에 있었다. 물론 정부과제 전담기관의 평가 위원으로 후배 연구원들의 과제 평가에는 지금도 활동하고 있다.


과제 심의를 앞두고 제안서와 발표 자료를 중심으로 컨소시엄사 전문가들과 토의하고 아울러 필요한 부분은 전문서적이나 Googling 조사를 해가며 열심히 공부하였다. 길지 않는 발표 시간에 효과적으로 컨소시엄의 역량과 강점을 평가 위원들에게 Appeal 하기 위해 반복적으로 Speaking 해보며 발표 연습을 했다. 코로나 상황으로 발표장에는 1명으로 배석자를 제한했으므로 수행 비중이 높은 이미지 데이터의 수집 및 가공 전문가를 참석 시켰다. 전문성이 필요한 인공지능 알고리즘 분야는 요령껏 커버해야 했다. 발표장에 가보니 소프트웨어 강소기업으로 이루어진 컨소시엄과 국책연구기관 등 총 3개의 컨소시엄이 있었다. 인공지능 알고리즘 분야에 방점을 둔다면 우리 컨소시엄이 취약해 보일 수밖에 없을 것 같았다.


그동안의 경험을 십분 발휘하여 과제 발표는 슬기롭게 마쳤지만 역시 경쟁 컨소시엄을 압도하기에는 우리의 역량이 부족했다. 짧은 기간이었지만 투입한 노력과 새롭게 진입할 수 있는 인공지능 분야에서 2위에 그쳐 기회를 잡지 못한 것이 못내 아쉬웠다. 한편으로는 과제 참여 준비과정에서 관련 분야의 동향이나 수준을 파악할 수 있었고, 5개월여 기간에 조금은 생소한 분야에서 그 많은 역무를 수행할 수 있었을까 하는 "“떡 줄 놈은 생각지도 않는데, 김칫국부터 마친 격"의 우려에 대한 안도감도 다가왔다. 어찌 되었건 향후 인공지능을 응용한 #비파괴평가 기술 개발의 전초전으로 Apply 해 보았으므로 헛된 시도는 아니었던 것으로 스스로 위안을 가져 본다.

조회수 0회댓글 0개

최근 게시물

전체 보기

로봇 이용 자동 탐상과 최근 비파괴검사 기술

어제 당진에 있는 바이오매스 발전소의 순환유동층 보일러(CFBC) 내부를 들어가 보았다. 이삼십 대 시절에는 울진과 월성에 건설 중인 원자력발전소의 콘크리트 격납용기 내부를 천장에서부터 바닥끝까지 이 잡듯이 돌아다닌 적이 있었다. 하지만...

비파괴 품질계측

병원에 가면 의사는 일차적으로 청진기를 이용하여 우리 몸 내부의 상태를 진단한다. 그 후 초음파, 방사선, MRI 촬영 등으로 몸 내부의 종양 여부나 혈관 상태 등을 육안으로 확인하는 상세한 진단을 수행한다. 초음파를 이용한 영상진단, X-선을...

초음파를 이용한 비파괴평가 방법

비파괴검사는 시험 대상물을 손상시키거나 분리 혹은 파괴하지 않고 결함 존재 여부나 상태 등을 파악하기 위해 활용된다. 검사대상체에 가해지는 물리적 에너지 유형에 따라 다양하게 구분되는데, 초음파 탐상검사는 사람의 귀에는 들리지 않는 높은...

Comments


bottom of page