미래유망직업
[전문가칼럼] 인간을 읽는 OTT 인공지능 서비스
#여성과학기술인#OTT#OTT인공지능#컴퓨터비전#감성컴퓨팅#XAI
조회수 1481
좋아요3
작성일2023-07-26
[전문가칼럼] 인간을 읽는 OTT 인공지능 서비스

세종대학교, 인공지능학과, 이수진
고려대학교 응용동물과학과 (동물번식학전공) 졸업
이화여자대학교 디자인학과 (사진전공) 디자인학 석사
서강대학교 미디어공학과 (컴퓨터비전 전공) 공학 석사 및 박사 수여
현재, 세종대학교 인공지능학과 조교수
중앙대학교 인문콘텐츠연구소 연구교수
중앙대학교 다빈치 SW교육원 특임교수
한국연구재단, 과학재단, 콘텐츠진흥원, 출판진흥원, 에너지기술평가원 등 국책 과제 수행
전남대,교통대,세종대,중앙대 외 다수 강의
1) 인간과 인공지능간의 상호작용, AC와 XAI
궁극적인 연구의 핵심은 인간과 인공지능간의 상호작용이다. 인공지능 기술 중 컴퓨터 비전, 감성 컴퓨팅(Affective Computing) 그리고 Explainable AI (XAI)라는 세 가지 주요 분야를 중심으로 연구하고 있다.
컴퓨터 비전은 이미지나 비디오를 이해하고 분석하는 인공지능의 한 분야이다. OTT 서비스에 이를 적용하면 사용자의 시청 패턴이나 선호하는 컨텐츠의 시각적 특성을 분석하고 이를 기반으로 개인화된 추천 시스템을 구축할 수 있다. 뿐만 아니라 특정 데이터를 수집 및 학습하여 새로운 이미지를 창작하는 알고리즘을 개발하여 새로운 콘텐츠 창작 방식을 선보일 수 있다.
Figure 1 Reading minds from face and creating the new face image by Sujin Lee and AI: In the faces of people included in this image are taken from a publicly available
감성 컴퓨팅은 인공지능 기술을 이용하여 이미지, 텍스트, 음성 등의 데이터에서 인간의 감정을 인식하고 이해하는 기술이다. 이 기술을 이용하면 사용자의 감정 상태를 판단하여 맞춤형 컨텐츠를 제공하는 것이 가능해진다. 컴퓨터 비전 기술은 이미지나 비디오 데이터에서 표정, 제스처, 신체 언어 등을 분석하여 감정을 인식하는 데 사용된다. 표정 인식(Emotion Recognition)은 얼굴 이미지에서 표정을 인식하고, 이를 통해 해당하는 감정(기쁨, 슬픔, 분노 등)을 분석하는데, 감정 기반의 상황 분석, 사용자 경험 개선, 광고 효과 분석 등에 활용할 수 있다. 예를 들면 사용자가 슬픔이나 기쁨 등의 감정을 느낄 때 이에 맞는 영화나 드라마를 추천할 수 있다.
마지막으로, XAI는 인공지능이 내린 결정이나 추천에 대한 과정을 설명할 수 있는 기술이다. 이를 OTT 서비스에 적용하면, 사용자에게 왜 특정 영화나 드라마를 추천하는지 그 이유를 설명해 주는 것이 가능해지고 사용자는 인공지능의 추천에 대한 신뢰도를 높일 수 있다.
Figure 2 Daily and seasonal heat usage patterns analysis in heat networks and eXplainable AI Model
인공지능 기술은 기계를 학습하여 인간과 같은 지능으로 뛰어난 추론 및 예측 능력을 갖추도록 알고리즘을 작성한다. 현재는 추론을 넘어서 창작의 영역까지 적용하고 있다. 인공지능 기술로 생겨나는 창작 영역이 기계가 인간 내면의 감성을 표현하고 이해하는데 유의미한 방법을 제시할 것이라고 생각한다.
앞서 소개한 연구 기술 등을 OTT 서비스에 활용한다면 서비스 사용자에 개선된 경험을 선사할 수 있다. 사용자와 서비스 간의 상호작용을 통해 인간과 더욱 가까워지는 인공지능 기술을 경험하게 될 것이다.
2) 동물 번식학에서 인공지능을 연구하기까지
학부 시절, 동물 번식학을 전공하며 소의 동결 정자 운동성에 대한 연구를 수행하면서 현미경을 통해 관찰한 미세 생물의 이미지에 매료되었다. 이 경험은 디자인학과 사진 전공으로 이끌어, 이미지에 대한 탐구를 기술적으로 해결하는 방법을 찾게 되었다. 물리 화학적인 방법으로 표현된 사진 이미지가 디지털 기술로 표현 방식이 변화하고 그 과정에서 이미지 탐구 영역을 컴퓨터 비전의 영역으로 확장했다.
서강대학교 미디어공학과의 비전 그래픽스 연구실에서 컴퓨터 비전 기술에 기반한 이미지 변형 알고리즘의 개발 및 연구에 집중했고 이를 통해 공학 석사와 박사 학위를 취득하게 되었다. 현재는 세종대학교 인공지능학과 교수로 이미지 창작에 관련하여 인공지능 기술을 연구하고 있다.
전통적인 프로그래밍은 규칙을 설정하고 그에 따라 알고리즘을 작성하는 반면, 머신러닝은 다양한 데이터를 바탕으로 패턴을 찾아내며 알고리즘을 학습시킨다. 데이터로부터 규칙을 창출해내는 이 방법은 매우 매력적이며, 이 방식을 이용한 컴퓨터 비전을 기반 인공지능 기술을 연구하고 있다. 방대한 얼굴 이미지 데이터를 통해 사람의 감정을 해독하는 감성 컴퓨팅 기술을 연구하고 있는데, 이는 인간의 감정을 읽어내는 인공지능이 인간지능과 유사할 수 있는 가능성을 제시해 주는 것이라고 믿고 있다. 인공지능과 사람 사이의 소통을 가로 막는 장벽을 허무는데 중요한 역할을 컴퓨터 비전과 감성 컴퓨팅 분야가 중요한 역할을 할 것이다.
3) 새로운 창작의 패러다임의 이슈
Figure 3 Create Image by Sujin Lee and A.I.Atelier
인공지능 기술이 OTT(Over-The-Top) 서비스와 관련하여 앞으로 발생할 가장 큰 이슈가 뭘까 생각해 봤을 때, 생성 모델로 인한 이미지 또는 텍스트의 콘텐츠 제작 영역을 꼽고 싶다. Diffusion 모델과 GPT(Generative Pre-trained Transformer) 모델의 성과가 놀라운데, Stable Diffusion으로 생성한 이미지, 그리고 chatGPT로 창작한 스토리 생성 등 작년만 해도 실험적으로 받아 들였지만 현재는 인간의 창작 능력에 의문을 제기할 정도로 기계가 놀라운 창작 능력을 보여주고 있다. 머지않아 누구나 AI 기술을 활용해 콘텐츠를 창작할 것이고 이것을 계기로 창작의 패러다임이 바뀔 것이다. 새로운 장르의 탄생이 될 수도 있다. (필자는 5년 전부터 인공지능 시대의 예술 작품에 대해 설명해 왔다.)
미디어의 변화는 기술 변화에서 시작되어 사회 변화로 이어진다. OTT시장의 변화가 곧 사회 변화로 이어질만큼 비가시적인 힘이 존재한다. 또 다른 이슈로는 개인화된 콘텐츠의 자연스러운 소비와 이에 따른 미디어 시장의 변화이다. 우리들이 허락한 개인 정보가 기반이 되어 인공지능 기술로 개발된, 추천 알고리즘의 투명성이 제기되고 있다. 사용자들은 점점 더 맞춤화 된 콘텐츠를 요구하고, 이를 제공하는 서비스들에 대한 신뢰도 역시 중요해지고 있다. 연구하고 있는 한 축의 설명가능한 인공지능(XAI)으로 이러한 문제를 해결하고, OTT시장에 직간접적으로 영향을 끼치지 않을까 생각한다
4) 인공지능이 사용자의 감정 상태를 이해하고 개선하다
컴퓨터 비전 기술은 인공지능의 발전 속에서 점차 중요성을 인정받고 있다. 예전에는 컴퓨터 비전에 대한 인지도가 낮았지만, 지금은 이 분야의 중요성을 이해하는 사람이 많아지며, 이미지 분석 및 인식 기술의 발전은 딥러닝과 기계 학습의 발전에 힘입어 빠르게 진행되고 있다.
비록 연구가 컴퓨터 비전에 초점을 맞추고 있지만, 필자는 인공지능 전문가로서 모든 도메인에 대해 열린 마음을 가지고 인공지능 기술로 에너지 소비 예측 및 열 효율 향상에 관한 중요한 과제를 수행하고 있다. 다양한 도메인에 대한 지식을 축적하고, 이를 바탕으로 데이터 분석과 모델 개발을 통해 기계가 보다 효과적으로 학습하고 추론할 수 있도록 연구한다.
컴퓨터 비전 연구는 다양한 이미지 데이터를 분석하여 이해 가능한 구조로 설계, 생성 및 소통의 매개로 확장할 수 있다. OTT 서비스 분야에서의 혁신을 생각해 본다면, 소셜 네트워크를 통한 이미지 소통 방식과 미디어 분석의 가능성을 생각해 볼 수 있다. 감성 분석 기술은 사용자의 감정과 의견을 소셜 미디어 플랫폼에서 분석하는 데 활용될 수 있는데, 텍스트 뿐만 아니라 표정이나 제스처 인식 등을 통해 분석할 수 있다. 이를 통해, 기업은 제품 및 서비스에 대한 고객의 반응을 실시간으로 파악하고, 마케팅 전략을 개선하거나 제품 개발 방향을 결정하는 데 도움을 받을 수 있다.
마지막으로, 컴퓨터 비전 기술과 감성 컴퓨팅 기술은 사용자의 감정과 선호도를 이해하는 데 중요한 도구가 된다. 이 기술들을 이용하면 음악, 독서, 영화 등의 추천 서비스를 개인의 취향과 감정 상태에 맞게 제공하는 것이 가능해지며, 이는 OTT 미디어 산업에서 사용자 만족도를 향상시키고 서비스 제공자와 사용자 간의 관계를 강화하는 데 큰 역할을 한다. 또한, 이러한 기술들은 사용자의 심리적 상태나 정신 건강 상태를 모니터링하고 개선하는 데에도 활용될 수 있다. 이렇게 인공지능이 사용자의 감정 상태를 이해하고 개선하는 연구는 미래의 인공지능 기술 발전에 큰 기여를 할 것으로 기대된다.
5. OTT기술이 가져올 윤리적인 문제에 대한 고민
시간과 공간을 고려하지 않고 OTT 서비스를 이용할 수 있다는 것은 다양한 콘텐츠에 자주 접근할 수 있다는 것을 말한다. 개인에게 더 많은 선택의 기회를 주고 개인의 특성을 고려한 개인 맞춤형 서비스를 제공받을 수 있다. 그러나 개인화 알고리즘으로 인한 폐쇄성과 문제 인식 능력의 저하를 야기할 수도 있다는 문제점이 있다.
산업의 변화에는 언제나 기술이 앞서 있었다. 전통적인 미디어 산업의 혁신은 더 많은 콘텐츠 제작자들이 작품을 공유하고 수익을 창출할 수 있는 기회를 제공한다. 반면, 선점하는 기업이 독과점할 수 있는 구조를 형성하고 있다. 기술의 매력은 이용 대상에 편견을 두지 않는다는 점인데 다르게는 철저하게 경제 논리에 맞춰 제공된다는 점이 OTT 서비스 시장에 부정적으로 반영되지 않았을까?
6. 해당 연구에 요구 되는 직무 스킬 등이 있다면?
인공지능 분야는 두 가지 자세가 필요하다. 첫 번째는 다양한 도메인에 대한 탐구 자세다. 우리 일상의 모든 것이 데이터로 변환할 수 있다. 다만 도메인의 특성을 잘 파악하고 고품질의 데이터 구축과 식별능력을 갖추려면 항상 의문점과 문제점에 대해 파악할 수 있어야 한다. 그리고 이미지, 텍스트, 음성 등 각기 다른 도메인의 데이터를 분석하고 예측하며 추론할 수 있어야 한다. 기계는 사람과 다르게 수치적 파악과 분석을 통해 문제를 해결하기 때문에 그것을 염두하고 알고리즘을 작성해야 한다. 점점 더 기술적 문제의 해결은 기계가 능동적으로 하도록 시스템이 설계될 것이다. 따라서 우리는 기계의 능동적 결정과 실행에 대해 감시 할 수 있는 능력을 갖추어야 한다.
7. 미래의 동료들에게 자유롭게 한마디 한다면?
책을 많이 읽자. 필자도 많이 들은 말이지만 쉬운 일은 아니다. 그럼에도 불구하고 책을 많이 읽어야 함을 점점 더 절감한다. 이유는 모든 서사는 앞 뒤 맥락이 있고 그것을 파악하는 능력이 중요하기 때문이다. 인공지능은 인간보다 더 인간적이게 될 수 있다. 왜냐면 그들은 대단히 많은 정보를 가지고 맥락을 따져 볼 수 있는 패턴을 학습하면서 판단의 기준을 만들어 가기 때문이다.
우리는 더 나은 삶을 누리고 행복해 지기 위해 인공지능 기술을 개발한다. 기계보다 나은 생각과 판단을 내릴 수 있는 사람이 되기 위해 (여러가지 방법이 있겠지만) 책을 읽어야 한다. 다시 한 번 강조하고 싶다.