Yapay Zeka Bilgileri: İnsansı Robotlar ve Embodied AI: 2026’da Fiziksel Yapay Zekanın Büyük Sıçraması

İnsansı Robotlar ve Embodied AI görsel 1

İnsansı Robotlar ve Embodied AI görsel 2

İnsansı robotlar ve embodied AI (fiziksel yapay zeka), 2026 yılında inanılmaz bir ivme kazandı. Sadece birkaç yıl önce hantal ve deneysel olan humanoid robotlar, artık fabrika katlarında tam mesai yapıyor, endüstriyel

tesisleri otonom olarak denetliyor ve hatta evlerimizde bize yardımcı olmaya hazırlanıyor. Bu yazıda, Mayıs 2026 itibarıyla fiziksel yapay zeka alanında yaşanan en önemli gelişmeleri, yeni model lansmanlarını ve sektörün yönünü detaylı olarak inceliyoruz.

Figure AI ve Helix-02: Sekiz Saatlik Otonom Vardiya Devrimi

Figure AI, 13 Mayıs 2026'da gerçekleştirdiği canlı yayınla humanoid robot dünyasının en iddialı demonstrasyonlarından birini sahneledi. Şirketin Helix-02 AI sistemiyle donatılmış Figure 03 robotları, tam sekiz saat boyunca hiçbir insan müdahalesi olmadan paket sıralama hattında çalıştı. Robotlar, barkod tarama, paket alma, yeniden konumlandırma ve bant üzerine yerleştirme işlemlerini saniyede yaklaşık 3 saniyelik insan-paritesi hızla gerçekleştirdi.

Helix Mimarisinin Evrimi

Helix sistemi, 2025 yılının Şubat ayında tanıtılmış ve Figure AI'ın OpenAI iş birliğinden bağımsız bir yola geçişinin sembolü olmuştu. Mimari, iki katmanlı bir yapı üzerine kurulu: System 2 (S2), internet üzerinde ön-eğitimlenmiş bir Vision Language Model (VLM) olarak 7-9 Hz frekansında çalışıyor. Sahne anlayışı, dil kavrama ve hedef sıralamasından sorumlu olan S2, "ne yapılmalı?" sorusuna yanıt veriyor. System 1 (S1) ise 200 Hz'de çalışan bir vizuomotor policy olarak, S2'nin akıl yürütme sonuçlarını 35 serbestlik derecesi boyunca hassas eklem komutlarına çeviriyor. Her iki katman da gömülü düşük güçlü GPU'larda çalışıyor ve bulut bağlantısı gerektirmiyor.

Helix-02 ve 109.000 Satırlık Kodun Ortadan Kalkması

Ocak 2026'da tanıtılan Helix-02, kontrolü üst gövdeden tüm robota — bacaklar, gövde, kollar ve parmaklar — genişleten kapsamlı bir güncellemeydi. System 0 (S0) adlı yeni bir temel katman, 1.000 saatten fazla insan hareket verisiyle eğitilmiş bir sinirsel kontrolör olarak daha önce 109.000 satırlık elle yazılmış C++ lokomosyon kodunun yerini aldı. Sonuç: Robot artık yürüyüş, denge ve manipülasyonu birbirine dikili ayrı kontrolörlerin birleşimi değil, tek bir sürekli davranış akışı olarak gerçekleştiriyor.

Figure 03'ün Hassas Dokunuşu

Ekim 2025'te tanıtılan Figure 03 donanımı, parmak uçlarında 3 gram basınç algılayabilen dokunsal sensörler taşıyor — bu, bir ataşın ağırlığını hissedebilecek kadar hassas olduğu anlamına geliyor. Görüş sistemi, Figure 02'ye kıyasla iki kat daha yüksek kare hızı, dörtte bir oranında düşük gecikme ve kamera başına yüzde 60 daha geniş görüş alanı sunuyor. Avuç içi kameraları ise yakın mesafe manipülasyonu mümkün kılıyor. Şirketin BotQ üretim tesisi, günde bir robot üretim kapasitesinden saatte bir robota ulaşarak 120 günden kısa sürede 24 kat artış sağladı ve şu ana kadar 350'den fazla üçüncü nesil robot teslim etti.

Google DeepMind: Gemini Robotics-ER 1.6 ve Embodied Reasoning

Google DeepMind, 14 Nisan 2026'da Gemini Robotics-ER 1.6'yı duyurdu. Bu model, robotların fiziksel dünyayı anlamasını sağlayan "embodied reasoning" (fiziksel akıl yürütme) yeteneklerinde önemli bir sıçrama sunuyor.

Uzamsal Akıl Yürütme ve İşaret Etme

Gemini Robotics-ER 1.6'nın temel yeteneklerinden biri "pointing" (işaret etme) kapasitesi. Model, bir görüntüdeki nesneleri sayabilir, en küçük öğeyi belirleyebilir, "Şu mavi kupanın içine sığabilecek her nesni işaret et" gibi karmaşık kısıtlamaları anlayabilir ve hareket yörüngeleri çizebilir. Önceki nesil ER 1.5, nesne sayılarını yanlış hesaplıyor ve var olmayan nesneleri halüsinasyon olarak gösteriyordu. ER 1.6 ise bu hataları büyük ölçüde gideriyor.

Başarı Tespiti ve Çok Görüşlü Anlayış

Robotikte bir görevin ne zaman tamamlandığını bilmek, görevi başlatmak kadar kritiktir. ER 1.6, birden fazla kamera akışını senkronize analiz ederek, özellikle örtüşme ve zayıf aydınlatma koşullarında bile görev tamamlanma durumunu güvenilir şekilde tespit edebiliyor.

Enstrüman Okuma: Endüstriyel Devrim

Belki de en çarpıcı yenilik, Boston Dynamics iş birliğiyle geliştirilen enstrüman okuma yeteneği. Endüstriyel tesislerdeki basınç göstergeleri, termometreler, kimyasal seviye camları ve dijital okuyucular gibi araçların otomatik olarak okunup yorumlanması, tesis denetim robotiği için oyun değiştirici bir kapasite. Spot robot köpeği, tesis içinde dolaşarak bu göstergeleri fotoğraflıyor ve ER 1.6, iğne konumları, sıvı seviyeleri ve birim etiketlerini anlayarak raporluyor.

ShengShu Motubrain: Tek Beyin, Sonsuz İmkan

Çinli ShengShu Technology, 15 Mayıs 2026'da Motubrain adlı dünya aksiyon modelini (world action model) tanıttı. Bu model, robotikteki "her görev için ayrı sistem" geleneğini kırarak tek bir birleşik modelle çok çeşitli görevleri gerçekleştirmeyi hedefliyor.

Birleşik Mimari: Video ve Aksiyon Birlikte Öğreniyor

Motubrain, Unified Multimodal Model üzerine kurulu ve video ile aksiyonu iki sürekli modalite olarak birlikte ele alıyor. Tek bir eğitim çalışmasıyla beş yetenek aynı anda kazanılıyor: görü-dil-aksiyon kontrolü (VLA), dünya modelleme, video üretimi, ters dinamik modelleme (IDM) ve ortak video-aksiyon tahmini. Üç akışlı Mixture-of-Transformers (MoT) mimarisi, video, aksiyon ve dilin güçlerini birleştiriyor.

Performans ve Ölçekleme

WorldArena'da 63.77 EWM Skoru ve RoboTwin 2.0'da 50 görevde ortalama 96.0 puan alan Motubrain, rastgele ortamlarda 95.0'ı aşan tek model olarak öne çıkıyor. Görev sayısı arttıkça başarı oranı yükseliyor: 50 görevde yaklaşık yüzde 92'ye ulaşırken, Pi-0.5 modeli aynı aralıkta yüzde 68'e düşüyor. Veri ölçeklemesinde de benzer üstünlük gösteriliyor.

Dört Temel İlke

Motubrain'in tasarım felsefesi dört ilkeye dayanıyor. Bir Beyin, Çoklu Beceri: görev çeşitliliği arttıkça model güçleniyor. Bir Beyin, Evrensel Robot: tek robot modeline bağlı değil. Bir Beyin, Uçtan Uca: en fazla 10 atomik aksiyon içeren karmaşık görev dizilerini baştan sona öğreniyor. Bir Beyin, Öngörücü: çevresel değişim, görev ilerlemesi ve yürütmeyi tek modelde birleştiriyor.

Genesis AI GENE-26.5: İnsan Seviyesinde Fiziksel Manipülasyon

Fransız startup Genesis AI, 6 Mayıs 2026'da GENE-26.5'i duyurarak robotik temel model dünyasına güçlü bir giriş yaptı. Şirket, GENE-26.5'i "robotlara insan seviyesinde fiziksel manipülasyon yeteneği kazandıran ilk yapay zeka beyni" olarak tanımlıyor. Bu model, robotik elle nesneleri tutma, bükme, sıkıştırma ve hassas yerleştirme gibi insan parmaklarının gerçekleştirdiği karmaşık hareketleri mümkün kılıyor. Genesis AI ayrıca insana benzeyen robotik el donanımını da tanıttı, böylece yazılım ve donanım entegrasyonunu birlikte sunan bir ekosistem ortaya koydu.

CMU'dan Touch Dreaming: Dokunma Hayali ile Hassas Manipülasyon

Carnegie Mellon Üniversitesi ve Bosch AI Merkezi'nden araştırmacılar, "Humanoid Transformer with Touch Dreaming" (HTD) adlı sistemi geliştirdi. Bu çalışma, humanoid robotların temas gerektiren görevlerdeki performansını büyük ölçüde artırıyor.

Dokunma Hayali Nedir?

HTD, sadece gelecekteki eylemleri değil, aynı zamanda dokunma ve kuvvet sinyallerinin gelecekteki evrimini de tahmin ediyor. Bu "touch dreaming" süreci, modelin fiziksel etkileşimler sırasında temasın nasıl gelişeceğini önceden hesaba katmasını sağlıyor. Ham dokunsal sensör verilerini doğrudan tahmin etmek yerine, yavaş güncellenen bir hedef ağ tarafından oluşturulan kompakt dokunsal latent temsilleri kullanılıyor. Bu sayede model, gürültülü düşük seviye sensör dalgalanmalarından ziyade anlamlı temas örüntülerine odaklanıyor.

Sonuçlar: Yüzde 90.9 Luk Başarı Artışı

HTD sistemi, havlu katlama, kitap düzenleme, sıkı toleranslı parça yerleştirme, alet kullanma ve çift elli çay servisi gibi beş zorlu görevde önceki yöntemlere kıyasla yüzde 90.9 daha yüksek başarı oranı gösterdi. Alt vücut kontrolörü, öğretmen-öğrenci yaklaşımıyla simülasyonda eğitilmiş ve gerçek dünyada dengesizlik yaratabilecek üst gövde manipülasyon bozulmalarına karşı dayanıklı hale getirilmiş.

SAP ve Cyberwave: Endüstriyel Otonom Robotikte İlk

SAP ve Cyberwave, 11 Mayıs 2026'da SAP'nin Walldorf lojistik deposunda tamamen otonom yapay zeka destekli robotların canlı operasyonlara entegrasyonunu duyurdu. Bu, büyük bir kurumsal yazılım şirketinin kendi lojistik tesislerinde fiziksel AI robotlarını üretim ortamına aldığı ilk örnek olarak öne çıkıyor. SAP, geçtiğimiz yıl duyurduğu Physical AI stratejik genişlemesinin doğal sonucu olarak bu adımı atmış bulunuyor.

Meta'nın Robotik Hamlesi ve Sektörel Yarış

Figure AI'ın sekiz saatlik demonstrasyonu, humanoid robot yarışının ivmelenmesine işaret ediyor. 1 Mayıs 2026'da Meta, Assured Robot Intelligence (ARI) startup'ını satın alarak humanoid robotik temel modelleri geliştirme alanına girdi. ARI'nin kurucuları Meta Superintelligence Labs'e katılırken, Marc Whitten (eski Cruise CEO'su) Reality Labs içindeki robotik bölümünü yönetmek üzere göreve başladı. Apptronik ise yeni finansman turunun ardından üretim kapasitesini artırmaya hazırlanıyor.

Embodied AI'ın Geleceği: Ne Bekliyoruz?

2026'nın ilk yarısında yaşanan gelişmeler, fiziksel yapay zekanın teorik araştırma laboratuvarlarından gerçek dünya uygulamasına geçişinin hızlandığını açıkça gösteriyor. Birkaç kritik eğilim öne çıkıyor:

Sinirsel Kontrolörlerin Yaygınlaşması

Figure AI'ın 109.000 satırlık elle yazılmış kodu sinirsel kontrolörle değiştirmesi, robotikte yazılım geliştirme paradigmalarının kökten değiştiğinin kanıtı. Geleneksel programlama yerine simülasyonda eğitilmiş sinir ağları, daha esnek ve uyarlanabilir hareket kontrolü sağlıyor.

Temel Model Yaklaşımının Yükselişi

Hem Motubrain hem de GENE-26.5, "tek beyin, çoklu görev" yaklaşımının benimsendiğini gösteriyor. Görev-özel modellerin yerini, çeşitli robot türlerinde ve senaryolarda genelleşebilen temel modeller alıyor. Bu, özellikle verimlilik ve ölçeklenebilirlik açısından devrim niteliğinde.

Dokunma ve Fiziksel Anlayışın Derinleşmesi

HTD'nin "touch dreaming" yaklaşımı ve Gemini Robotics-ER 1.6'nın uzamsal akıl yürütme kapasiteleri, robotların sadece görmekle kalmayıp "hissetmeye" ve fiziksel dünyayı anlamaya başladığını gösteriyor. Bu, özellikle ince manipülasyon görevlerinde performansı dramatik olarak artırıyor.

Endüstriyel Benimseme Hızlanıyor

SAP/Cyberwave'ın canlı depo entegrasyonu ve Figure'ın saatte bir robot üretim kapasitesi, teknolojinin pik'ten plateau'ya geçişinin başladığına işaret ediyor. 2026 sonu itibarıyla endüstriyel humanoid robot deployments'unun önemli ölçüde artması bekleniyor.

Çok Robotlu Koordinasyon

Figure AI'ın iki robotun ortak yatak yapma demonstrasyonu, robotların birbirlerinin niyetini sadece hareketlerden çıkararak koordine olabildiğini gösteriyor. Paylaşılan planlayıcı veya mesajlaşma olmadan gerçekleşen bu koordinasyon, çok robotlu sistemlerin geleceğine dair güçlü sinyaller veriyor.

Sonuç

Mayıs 2026 itibarıyla embodied AI ve humanoid robotik alanı, bir dönüm noktasından geçiyor. Figure AI'ın otonom sekiz saatlik vardiyaları, DeepMind'ın endüstriyel enstrüman okuma kapasitesi, ShengShu'nun birleşik dünya aksiyon modeli, Genesis AI'ın insan seviyesinde manipülasyon beyni ve CMU'nun dokunma hayali sistemi — hepsi farklı yönlerden aynı hedefe yöneliyor: Robotların fiziksel dünyayı anlaması, etkileşime girmesi ve otonom olarak görevleri tamamlaması. Bu gelişmeler, sadece teknolojik bir gösteri değil, üretim, lojistik, sağlık ve ev ortamlarında köklü dönüşümlerin habercisi. 2026'nın geri kalanı ve 2027, humanoid robotların endüstriyel ölçekte konuşlandırılması ve fiziksel AI modellerinin olgunlaşması açısından kritik bir dönem olacak. Takip etmeye değer.

Sıkça Sorulan Sorular

Embodied AI nedir?

Embodied AI (fiziksel yapay zeka), yapay zeka modellerinin fiziksel bir gövde — robot, otonom araç, drone vb. — aracılığıyla gerçek dünya ile etkileşime girmesini sağlayan yaklaşımı ifade eder. Sadece dijital ortamda kalmaz, fiziksel dünyayı algılar ve üzerinde eylemde bulunur.

Figure AI Helix-02'nin önceki modellerden farkı nedir?

Helix-02, kontrolü sadece üst gövdeden tüm robota genişleten System 0 (S0) katmanını tanıtır. Bu katman, 1.000 saatten fazla insan hareket verisiyle eğitilmiş bir sinirsel kontrolör olup 109.000 satırlık elle yazılmış lokomosyon kodunun yerini almıştır. Böylece robot yürüyüş, denge ve manipülasyonu kesintisiz bir akışla gerçekleştirir.

Motubrain diğer robotik modellerden nasıl ayrışır?

Motubrain, görev-özel modellerin aksine "tek beyin" yaklaşımı benimser. Video ve aksiyonu birlikte öğrenen birleşik bir mimari kullanır ve görev sayısı arttıkça başarı oranı yükselir. Ayrıca farklı robot türlerinde genelleşebilir ve 10 atomik aksiyona kadar karmaşık görev zincirlerini uçtan uca yürütebilir.

Touch Dreaming yöntemi robotlara ne kazandırır?

Touch Dreaming, robotların sadece gelecekteki hareketleri değil, dokunma ve kuvvet sinyallerinin gelecekteki evrimini de tahmin etmesini sağlar. Bu sayede temas gerektiren görevlerde model, fiziksel etkileşimin nasıl gelişeceğini önceden hesaba katarak yüzde 90.9'a varan başarı artışı sağlar.

İnsansı robotlar ne zaman yaygın olarak evlere girecek?

Mevcut gelişme hızıyla, 2027-2028 yıllarında ilk tüketici düzeyinde humanoid robotların pilot kullanımına, 2030 civarında ise daha geniş çaplı benimsemeye işaret ediliyor. Ancak maliyet, güvenlik düzenlemeleri ve teknik güvenilirlik gibi faktörler bu zaman çizelgesini etkileyebilir.

İnsansı Robotlar ve Embodied AI: 2026’da Fiziksel Yapay Zekanın Büyük Sıçraması