바카라 서빙바카라 서빙
3 월 13 일 뉴스, 수요일 Google의 Deepmind Laboratory는 제어를위한 두 가지 새로운 인공 지능 모델 인 Gemini Robotics와 Gemini Robotics-er를 발표했다고 발표했습니다. 이 모델은 이러한 모델이 다양한 형태의 미세한 운동 기술과 환경 적응성의 로봇을 제공하고 물리 세계에서의 상호 작용 효율성을 크게 향상 시키며 Humanoid Robot Assistant와 같은 응용 프로그램의 구현을 촉진 할 수 있다고 주장합니다.
로봇 플랫폼에 사용되는 하드웨어가 꾸준히 발전하고 있지만 (항상 그런 것은 아니지만) 인공 지능 시스템이 로봇을 안전하고 정확하게 제어하여 알려지지 않은 시나리오를 처리 할 수 있도록하는 방법은 항상 업계 과제였습니다. 업계에서 소위 "구체화 된 지능"은 다른 기술 거인의 "달 착륙 계획"일뿐 만 아니라 일반 로봇의 노동 시대를 여는 열쇠이기도합니다.
Google이 개발 한 새로운 모델은 Gemini 2.0 언어 모델을 기반으로하며 로봇 애플리케이션에 관련 기능을 특별히 추가했습니다. 그 중 Gemini Robotics는 Google이 "Vision-Language-Action"(VLA) 기능을 통합하여 시각적 정보를 처리하고 언어 지침을 이해하며 물리적 행동 지침을 생성 할 수 있습니다. Gemini Robotics-ER은 "구체화 된 추론", 공간인지 능력 향상 및 기존 로봇 제어 시스템에 원활하게 연결하는 데 중점을 둡니다.
예를 들어바카라 서빙, Gemini Robotics는 로봇에 "바스켓에 바나나를 넣는 것"을 명령 할 수 있습니다.이 카메라를 사용하여 바나나를 인식하기 위해 장면 이미지를 얻은 다음 로봇을 성공적으로 완료하여 "원래 여우"를 완료 할 수 있습니다.
2023 년에 개발 된 RT -2 모델은 인터넷 데이터를 사용하여 로봇이 언어 지침을 이해하고 새로운 시나리오에 적응하도록 돕는 Universal Robot 기능으로의 중요한 단계를 수행합니다. 2 년 후, Gemini Robotics는 지침을 이해하는 데 도움이 될뿐만 아니라 RT-2가 처리 할 수없는 복잡한 물리적 작업을 수행하는 데 큰 진전을 보인 것으로 보입니다.
RT-2는 훈련 된 신체 행동 만 재현 할 수 있지만 Gemini Robotics의 유연성은 질적 도약을 달성했으며 종이 접기 및 스낵 포장과 같은 어려운 작업을 완료 할 수 있습니다. 지침 만 이해하는 로봇에서 훌륭한 물리적 작업을 수행 할 수있는 로봇에 이르기 까지이 변화는 DeepMind가 로봇 공학 분야에서 가장 큰 도전을 점차 해결하고 있음을 보여줍니다.
일반화 능력은 크게 개선되었습니다
Deepmind는 새로 출시 된 Gemini Robotics 시스템이 더 강력한 일반화바카라 서빙, 즉 이전 AI 모델을 초과하는 새로운 작업을 수행 할 수있는 능력을 강력하게 보여 주었다고 말했습니다. 이 회사는 포괄적 인 일반화 벤치 마크에서 Gemini Robotics의 성과가 "유사한 성능의 최고의 모델보다 두 배 이상 높다"고 말했다. 이 일반화 기능은 매우 중요합니다. 즉, 로봇은 각 시나리오에 대한 전문 교육없이 미래의 새로운 상황에 적응할 수 있으며 예측할 수없는 실제 환경에서도 작동 할 수도 있음을 의미합니다.
이것은 사람들이 여전히 휴머노이드 로봇의 실용성과 능력에 대해 의문을 가지고 있기 때문에 특히 중요합니다. 작년 10 월, Tesla는 여러 가지 물리적 작업을 완료 할 수 있다고 주장하면서 옵티머스 Gen 3 Humanoid Robot을 유명한 방식으로 시연했지만, 여러 로봇은 원격으로 조작되는 것으로 입증되었으며, 이는 Tesla의 자율적 인공 지능에서 실제 기능에 대한 우려를 제기했습니다.
Google은 진정한 "Universal Machine Brain"을 만들려고합니다. 이를 위해 Google은 텍사스 오스틴에 본사를 둔 Apptronik과 파트너십을 발표하여 Gemini 2.0을 기반으로 차세대 휴머노이드 로봇을 구축했습니다. 이 모델은 주로 이중 로봇 팔 플랫폼 Aloha 2에서 훈련되었지만 Gemini Robotics는 Franka Robotic Arms 및 Apptronik Apollo Humanoid Robot과 같은보다 복잡한 시스템을 포함한 다양한 유형의 로봇을 제어하는 데 사용될 수 있다고 Google은 말합니다.
Humanoid Robot의 적용은 대형 언어 모델을 기반으로 Google의 생성 인공 지능에 비교적 참신하지만 Google은 2013 년부터 2014 년 초에 여러 로봇 회사를 인수하여 Boston Dynamics (현재 현대 그룹에 속해 있음)를 포함하여 잘 알려진 휴머노이드 로봇을 만들었지 만 나중에 판매되었습니다. AppTronik과의 새로운 협력은 이전 전략의 연속이 아니라 Humanoid Robot의 분야를 탐색하려는 Google의 새로운 시도 인 것 같습니다.
다른 회사는 또한 인간형 로봇 하드웨어를 개발하기 위해 열심히 노력하고 있으며, AI는 2024 년 3 월 자체 인간형 로봇에 대한 많은 양의 자금 조달을했으며, 전 알파벳 자회사 인 Boston Dynamics는 작년에 유연한 New Atlas 로봇을 출시했습니다. 그러나 지금까지 업계에는 로봇을 실용적으로 만들 수있는 인공 지능 제어 시스템이 없었습니다. Google은 또한 신뢰할 수있는 테스터 프로그램을 통해 Boston Dynamics, Agility Robotics 및 Enchanted Tools와 같은 회사에 Gemini Robotics-ER에 대한 액세스가 제한 될 것이라고 발표했습니다.
보안 및 제한 사항
보안 측면에서 Google은 안티 콜리전 및 힘 제한과 같은 전통적인 로봇 보안 메커니즘을 보존하기 위해 "다단계 전체적 전략"을 채택한다고 언급했습니다. 이 회사는 또한 Asimov의 "Robot Constitution"프레임 워크를 시작하기 위해 Asimov의 "Three Laws of Robots"에서 영감을 얻었으며,이를 바탕으로 연구자들이 로봇 행동의 보안 영향을 평가할 수 있도록 Asimov 보안 데이터 세트를 발표했습니다..
새로운 Asimov 데이터 세트는 Google이 물리적 손상을 방지하기위한 것이 아니라 표준화 된 방법을 통해 로봇 안전을 평가하기를 희망합니다. 이 데이터 세트는 연구자들이 다양한 시나리오에서 로봇 행동 결과에 대한 인공 지능 모델의인지 능력을 테스트 할 수 있도록 설계되었습니다. Google 발표에 따르면 Asimov 데이터 세트는 "실제 시나리오에서 로봇 행동의 보안 영향을 엄격하게 측정하는 데 도움이됩니다.
Google은 여전히 연구 단계에있는 상업용 응용 프로그램 수준에서 새로운 모델 또는 특정 계획을위한 시간표를 발표하지 않았습니다. Google의 데모 비디오는 인공 지능의 놀라운 발전을 보여 주지만 통제 된 환경의 실험은 여전히 실제 세계에서 이러한 시스템의 실제 성능을 완전히 반영하는 데 어려움을 겪고 있습니다. (Chenchen)