Otomatik pilot, ileri teknolojiyi kullanarak otonom sürüş sistemlerini haritalandıran ve araçların potansiyelini gösteren bir inovasyondur. Ancak, özellikle otonom sürüş konusunda güncel bilgilere sahip değilseniz, konu karmaşık gelebilir.
Eğer bir Tesla’nın sadece görüntü almakla kalmayıp yollarda nasıl hareket ettiğini merak ediyorsanız, aradığınız bilgileri içerecek bir yazı aşağıda sunulmuştur. 19 Ağustos 2021 tarihinde, Tesla’nın Yapay Zeka Direktörü Andrej Karpathy ve diğer ekip üyeleri, Tesla’nın otomatik pilotunun sekiz kamera aracılığıyla nasıl görüntü elde ettiğinden, yollar üzerindeki navigasyon sürecine kadar olan çalışma prensibini halka açıkladı.
Peki, “Tesla Otomatik Pilot” sistemi tam olarak nedir ve neden herkes bu kadar heyecanlı ve tartışmalı? İşte bu ileri teknolojinin özeti: Ne olduğu, neler yapabildiği -daha da önemlisi- neler yapamayacağı hakkında bilgi sahibi olabilirsiniz.
Tesla Autopilot Sistemi
Tesla Autopilot, otonom sürücü yardım sistemine sahip bir teknoloji olarak bilinir. Kısacası, bir Tesla’nın çevresindeki araçları ve yolunu ‘görmesine’ ve sınırlı bir şekilde kendi kendini sürmesine olanak tanıyan bir özelliktir. Ancak, ismine rağmen Autopilot, bir Tesla’yı tamamen otonom, yani kendi kendini süren bir araca dönüştürmez. Bu sistem kullanışlı olabilir, ancak hala oldukça sınırlıdır ve her an kontrolü ele alabilmesi için dikkatli bir sürücü gerektirir.
Tesla, birçok kişiye göre sürücüsüz araçlar konusundaki yarışta öncülük ediyor. Elon Musk’ın ifadesiyle, 300 “Jedi mühendis”ten oluşan bir ekip, şeritte kalma, şerit değiştirme ve hız sabitleyici gibi en karmaşık sorunlara çözümler getiriyor. Otonom araçlar, şerit tespitinden yaya takibine kadar her şeyi içeren önemli özelliklere sahip olmalı ve her türlü senaryoyu öngörmelidir. Bu amaçla, yalnızca “Tesla Vision” adı verilen kameralarla çalışan bir algılama sistemi kullanılmaktadır.
HydraNet Sistemleri
Tesla’nızı otopilot modunda kullanırken, çevresindeki nesneleri algılamak ve kararlar vermek zorundadır. Yol üzerindeki nesneler, diğer araçlar ve insanlar, trafik ışıkları ve dur işaretleri, içinde kalınması gereken şerit çizgileri gibi bir dizi görev bulunmaktadır. Bu görevler, aracınızın anlaması gereken bazı örnek görevlerdir. Araç hareket etmiyorken bile, örneğin bir yol ayrımında, anlık olarak yaklaşık 100 görev bulunabilir. Her görev için ayrı bir sinir ağı kullanmak hem maliyetli hem de verimsiz olabilir. Tesla AI, büyük miktarda bilgiyi gerçek zamanlı olarak işleyerek bu zorlukları aşar.
Bunun için, “Computer Vision” iş akışı, tüm görevleri aynı anda işleyebilen ResNet-50 adlı paylaşılan bir omurga üzerinde çalışır. Bu omurga, HydraNet olarak adlandırılan ve aracın farklı görevleri çözmek için kullanılan birden fazla örneği içeren bir yapıdır. Örneğin, dur işaretleriyle başa çıkmak için bir görev, yayaları idare etmek için başka bir görev ve trafik ışıklarını kontrol etmek için başka bir görev olabilir. Bu HydraNet mimarisi, her görevin devasa bir sinir ağına ihtiyaç duymadığı bir metodoloji üzerine çalışır. Ortak bir omurgaya sahip olduğundan, belirli görevler için belirli blokları eğitme gibi transfer öğrenimine benzer bir prensibi içerir. HydraNet’ler, her türlü nesne üzerinde eğitilmiş omurgalara ve belirli görevlerde eğitilmiş kafalara sahiptir. Bu, modelin eğitilme süresi ve çıkarım hızını artırır.
PyTorch ile Modelin Eğitimi
Yapay sinir ağları geliştirildikten sonra, modelin eğitilmesi elzemdir. Tesla, fütüristik bilgisayarlı görme yeteneklerini harekete geçirmek için bir dizi kütüphane ve araca arka planda başvurur. Bu çerçeve, özgün olarak Facebook’un AI Araştırma laboratuvarı (FAIR) tarafından geliştirilen PyTorch’tur. Tesla, derin öğrenme modellerini eğitmek için PyTorch’u tercih eder.
Tesla’nın dikkate değer bir özelliği, tam özerklik için LIDAR veya harita kullanmamasıdır. Şirket, gerçek zamanlı olarak işlem yapar ve tamamen kameralara ve saf bilgisayar görüşüne bağlıdır. Eğitim süreci ve diğer destekleyici görevler için Tesla, otomatik iş akışı planlaması, model eşik kalibrasyonu, kapsamlı değerlendirme, pasif testler ve simülasyon testleri gibi bir dizi işlem için yine PyTorch’u kullanır.
Vektör Alanı
Tesla’nın araçlarında 8 adet kamera bulunmaktadır ve bu kameralar, aracın çevresini geniş bir perspektifte görmesini sağlar. Ancak, bu sekiz kameradan elde edilen bilgileri doğrudan bir yapay zekaya iletmek, aynı anda bu kadar fazla veriyi işlemek bilgisayarlar için henüz mümkün değildir. Bu zorluğu aşmak için Tesla, sekiz kameradan gelen verileri daha küçük bir alana, yani “vektör alanı”na aktarır. Bu alan, çevredeki önemli bilgileri içeren bir 3D temsil sunar, örneğin yol işaretleri, diğer araçlar, insanlar ve şerit çizgileri.
Ancak, 8×3 boyutlu renkli görüntülerden nasıl oluyor da tek bir 3D çıktı elde ediliyor? Bu işlem dört adımda gerçekleşir ve sekiz kamera için paralel olarak uygulanır, bu da sistemi son derece verimli kılar.
Özetle, ilk adımda sekiz kamera tarafından çekilen fotoğraflar elde edilir. Bu bilgiler, kalibrasyon sürecinden geçirildikten sonra yoğunlaştırıcı bir CNN’ye gönderilir. CNN, bilgileri etkili bir şekilde işleyerek bunları birleştirir ve ardından bir transformatör mimarisine iletmek üzere sekiz kameradan gelen bilgileri tek bir 3D gösterimde birleştirir. Son olarak, bu 3D temsil birkaç kare boyunca önbelleğe kaydedilir ve daha sonra, tüm bu kareleri kullanarak 3D alanın son sürümünü çıkarmak üzere bir RNN mimarisine gönderilir. RNN, bu aşamada bireysel olarak eğitilebilir ve performans ile verimliliği maksimum düzeye çıkarmak için paralel olarak çalışabilir. Bu karmaşık mimari hakkında daha fazla teknik detayı incelemek isteyenler, ilgili videoya göz atabilirler.
Neden Sadece Kameralar Kullanılıyor?
Tesla’nın sadece kameraları kullanması, Autopilot’un tahminlerde bulunmak ve aracı hedefe yönlendirmek için yalnızca görsel bilgileri kullanmasına dayanır. Tesla araçlarında aracın yanlarına dağıtılmış 8 adet kamera bulunurken, LiDAR gibi başka sensörler kullanılmamaktadır. Elon Musk, LiDAR teknolojisinin “aptal işi” olduğunu ve gereksiz pahalı sensörler içerdiğini ifade etmiştir.
Bu kararın temel mantığı, kamera tabanlı görsel sistemi daha da geliştirmenin faydalı olmasına rağmen, LiDAR teknolojisinin pahalı ve gereksiz olduğunu düşünmektir. İnsanlar, radar benzeri bir teknoloji olmadan dünyada otonom olarak gezinebilmektedir, bu nedenle araçların da benzer bir yeteneğe sahip olması gerektiği düşünülmektedir. Teknolojiyi doğadan uzaklaştırmak bazen tekerlekler, uçaklar ve denizaltılar gibi inanılmaz başarılar elde etmiş olsa da, sadece görsel bilgilere dayalı otonom bir sistem geliştirmek için geçerli olup olmadığını zaman gösterecektir.
Hatırlatma
Autopilot’un bir aracı tamamen otonom hale getirmediği ve hala 2. Seviye otonom sürüş sistemi olarak sınıflandırıldığı önemlidir. Birçok özelliği hala beta aşamasındadır ve sürücü girişi gerektirebilir. Tamamen otonom bir araç, “Seviye 5” sistemi olarak sınıflandırılır ve henüz bu tür araçlar ticari olarak satışa sunulmamıştır. Autopilot ismi, bir Tesla’nın kendi kendisini sürebileceği izlenimini verse de, henüz kusursuz bir sistem olmadığını unutmamak önemlidir.