[윤석용의 철강AI] ‘데이터의 가치’
[윤석용의 철강AI] ‘데이터의 가치’
  • 윤석용
  • 승인 2024.03.28 03:00
  • 댓글 0
이 기사를 공유합니다

윤석용 교수 (명지대 기록정보과학대학원 AI정보과학전공)
윤석용 교수 (명지대 기록정보과학대학원 AI정보과학전공)

Value 즉 ‘가치’는 상품, 자원, 서비스, 노동, 자산 등의 실체 혹은 가상의 존재에 부여되는 추상적 개념의 상대치(相對値)라고 정의할 수 있다. 이를 좀 더 구체화하면 공급과 수요에 의하여 결정되는 시장의 가치(Market Value), 노동과 기술로 만들어 내는 노동의 가치(Labor Value), 자산과 경제적 관계로 만들어지는 재산의 가치(Property Value) 등의 실존적 가치 외에도 주관적인 가치(Subjective Value)와 부가된 가치(Added Value) 등도 있다.

최근 인공지능, 기계학습이 가전, 자동차, 스마트폰, 채팅 서비스 내에 슬그머니 들어와 놀라움과 많은 가능성을 보여주고 있다. 그렇다면 기업 또한 인공지능이 만들어 내는 변화에 등을 돌릴 수 없고, 어쩌면 선제적으로 인공지능의 도입을 기업 혁신 도구로 검토할 필요가 있다.

인공지능과 기계학습의 구현은 관찰을 통한 원리의 탐색이나 삼단논법과 같은 논리적 접근법인 연역적 방법(Deductive Methods) 만으로는 한계가 있음을 20세기 말 전문가시스템에서 보여주었다. 그러나 지금의 인공지능 구현은 데이터에 기반한 귀납적 방법(Inductive Methods)으로 의미 있는 성과와 많은 발전 가능성을 보여주고 있다. 귀납적 방법이란 특정 사례나 관찰을 통하여 나타난 데이터를 이용하여 규칙, 법칙 또는 패턴을 추출하는 방법으로 정확한 특정의 값을 도출하는 것이 아닌 일반화(Generalization)에 그 목적이 있다.

인공지능과 기계학습에서 일반화의 결과를 모형(Model)이라고 하고, 모형에 의하여 나타난 값은 어느 정도의 오류를 갖고 있는 확률값이라고 할 수 있다. 여기서 주목할 것이 바로 결과 값의 분산과 결과 내 오류의 존재이다. 인공지능과 기계학습은 어쩌면 이러한 오류를 최소화하기 위한 노력의 결과물이라고 할 수 있다. 오류는 결 과값의 차이 또는 성능의 차이를 포함하기 때문에 이를 최소화하여 업무에 적용할 수 있는 수준까지 맞추기 위한 튜닝(Model Tuning) 과정을 요구한다.

그럼 다시 데이터로 이야기를 돌려보자. 인공지능과 기계학습의 시작점이 데이터라고 한다면, 튜닝이라는 후발적 조치에 앞서 데이터가 충분한 품질을 갖고 있다면 어떠할까? 관리되지 않는 품질 낮은 데이터를 활용하여 알고리즘과 튜닝만으로 의미 있는 인공지능을 구현할 수는 없다. 완벽한 인공지능의 구현이 100이라고 한다면, 이를 구성하는 데이터와 튜닝의 역할 비율은 80대 20정도가 아닐까 생각된다.

지금까지 많은 기업에서 제품 품질이나 납품 관리 등의 목적으로 데이터를 모니터링용으로 활용하거나 아니면 부산물(By-products) 정도로 취급하여 왔다. 그러나 이제 데이터는 생산된 제품의 주체이고 기업 미래 가치의 핵심으로 인식할 필요가 있다. ‘데이터의 가치’를 명확하게 인식하고, 이를 전략적으로 활용하려는 노력은 새로운 제품을 만들고 기존 제품의 생산 혁신을 이루기 위한 필수 요소라고 볼 수 있다.

철강생산공정에서 만들어지는 많은 시계열성 데이터(Time Series Data)는 특정 시간 단위, 예를 들면 초 단위로 요약된 평균값을 데이터베이스에 저장하여 활용하고 있으나 도메인 특성을 감안하여 재검토가 필요할 수 있다. 예를 들어 PLC에서 밀리초, 마이크로초, 나노초 단위로 측정된 값을 초 단위로 평균 처리한다면 원천 데이터가 갖고 있는 정보는 손실되어 향후 복구가 불가능하다. 무한정 방대한 데이터를 쌓을 수 없는 현실적 이슈는 있지만, 손실된 데이터에 가치 있는 정보가 포함될 수 있어 현재 데이터베이스에 저장되고 있는 데이터도 다시 검토할 필요가 있다는 것이다. 또한 데이터 분석은 이러한 수치형 데이터뿐만 아니라 비정형 데이터와 벨류 체인상의 외부 데이터까지를 포함해야 하기에, 데이터관리체계인 전사적 데이터웨어하우스(Enterprise Data Warehouse) 또는 데이터 레이크(Data Lake) 등의 데이터 인프라 구축과 데이터 품질관리를 위한 거버넌스의 필요성이 다시 부각되고 있다.

아직 적지 않은 기업에서 인공지능 관련 솔루션의 도입만으로 기업의 혁신이 이루어지고 생산성이 배가될 것이라는 유토피아를 생각하는 것 같다. 인공지능의 시작은 ‘데이터의 가치’를 인식하고 그 데이터를 활용하기 위한 데이터과학과 데이터 기반의 의사결정 기업문화를 내재화하는 것이 시작점임을 이해할 필요가 있다. 생산 현장에서 아무리 많은 데이터가 만들어져도 그 가치를 인식하지 못하면 버려지는 진주가 될 수 있다.

철강업은 이제 철강 제품만을 만드는 제조업이 아닌 환경적 이슈를 선도하고 인공지능으로 혁신을 이루는 ‘데이터 기업’으로의 과감한 변신을 요구받고 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.