
오픈AI 연구진은 로봇 팔이 양손으로 대문자로 인쇄된 육면체 큐브를 맞추도록 가르쳤다. 시스템을 교육한 결과 로봇 팔은 인간의 손과 가까운 움직임을 보일 수 있었다. 예를 들어 손가락 방향 전환, 슬라이딩, 손가락 연결 동작 등이다. 로봇은 블록을 떨어뜨리지 않고 돌려서 특정 문자를 보여줄 수 있었다.
연구진이 사용한 기법은 강화학습(reinforcement learning)이었다. 이들은 시뮬레이션을 통해 로봇 팔이 물체를 파악하고 블록을 가지고 노는 다양한 방법을 실험했다. 오픈AI의 엔지니어인 마티아스 플라퍼트는 "처음에는 로봇이 무작위로 작업을 진행하도록 했고 물론 실패할 때도 있었다. 우리는 임의로 시각적 잡음을 추가하거나 가상 손의 색을 바꾸거나 장난감 큐브의 크기를 변경하는 등 다양한 변화를 적용했다"고 설명했다.
시간이 지나면서 로봇 팔은 블록을 회전시키는 경험을 쌓게 됐다. 즉 이런 트레이닝을 통해 AI가 실제 물리적 세계에서 큐브를 조작하는 방법을 익힌 것이다.
연구진은 이것을 댁틸(Dactyl) 시스템이라고 불렀다. 이런 무작위화 트레이닝이 없다면 로봇 팔이 손재주를 향상시킬 수 없었을 것이다.
저작권자 © 데일리시큐 무단전재 및 재배포 금지