Pomimo ogromnych postępów, jakie poczyniła ta dziedzina w ostatnim czasie i jej perspektyw na przyszłość, dzisiejsze roboty nadal mają dość ograniczone możliwości rozwiązywania problemów, ich umiejętności komunikacyjne są często słabe, a opracowywanie nowych robotów trwa zbyt długo. Aby ich zastosowanie stało się powszechne, będą musiały zostać naturalnie zintegrowane ze światem ludzi, a nie by ludzie zostali zintegrowani ze światem maszyn.

Roboty mogą rozumować tylko w ograniczonym zakresie, ponieważ rządzą nimi bardzo specyficzne obliczenia komputerowe. Dzisiejszym robotom wszystko tłumaczy się za pomocą prostych instrukcji, a zakres ich możliwości jest ograniczony do zawartego w nich oprogramowania. Zadania, nad którymi człowiek się nie zastanawia, takie jak zastanawianie się czy byłeś już w danym miejscu, są bardzo trudne dla robotów.

Roboty zapisują charakterystykę miejsc, które odwiedziły. Odbierają je za pomocą czujników takich jak kamery czy skanery laserowe. Maszynie trudno jest odróżnić cechy sceny, którą już widziała, od nowej sceny, która zawiera pewne obiekty z poprzedniej. Ogólnie rzecz biorąc, czujniki zbierają zbyt wiele danych, które są również na bardzo niskim poziomie aby roboty mogły je dobrze wykorzystać. Obecne badania nad uczeniem maszynowym z big data koncentrują się na tym, jak skompresować duże zbiory danych, aby uzyskać mniejszą liczbę semantycznie spójnych punktów orientacyjnych. Roboty mogą również używać podsumowań. Na przykład, mogłyby podsumować swoją historię wizualną i w ten sposób znacznie zmniejszyć liczbę obrazów, których potrzebują, aby określić czy były już w danym miejscu.