Σύστημα τεχνητής νοημοσύνης μπορεί να μάθει σε ρομπότ μια οικιακή αγγαρεία σε 20 λεπτά

Σύστημα τεχνητής νοημοσύνης μπορεί να μάθει σε ρομπότ μια οικιακή αγγαρεία σε 20 λεπτά

Άνοιξε ο δρόμος ώστε το μέλλον των οικιακών εργασιών να είναι υπόθεση των ρομπότ. Το σύστημα ανοιχτού κώδικα, που ονομάζεται Dobb-E, έχει τη δυνατότητα να διδάξει ένα ρομπότ πώς να ανοίγει μια φριτέζα, να κλείνει μια πόρτα ή να ισιώνει ένα μαξιλάρι, μεταξύ άλλων εργασιών, μόνο μέσα σε 20 λεπτά.

Πρόβλημα με τις βάσεις δεδομένων

Ενώ άλλοι τύποι τεχνητής νοημοσύνης, όπως μοντέλα μεγάλων γλωσσών, εκπαιδεύονται σε τεράστιες αποθήκες δεδομένων που έχουν αφαιρεθεί από το Διαδίκτυο, το ίδιο δεν μπορεί να γίνει με τα ρομπότ, επειδή τα δεδομένα πρέπει να συλλέγονται με εμπράγματο τρόπο. Αυτό καθιστά πολύ πιο δύσκολη τη δημιουργία και την κλιμάκωση των βάσεων δεδομένων εκπαίδευσης.

Ομοίως, ενώ είναι σχετικά εύκολο να εκπαιδεύσετε ρομπότ να εκτελούν εργασίες μέσα σε ένα εργαστήριο, αυτές οι συνθήκες δεν αντιστοιχούν απαραίτητα στην απρόβλεπτη κατάσταση ενός πραγματικού σπιτιού.

Για την καταπολέμηση αυτών των προβλημάτων, η ομάδα που ανέπτυξε το Dobb-E βρήκε έναν απλό, εύκολα αναπαραγόμενο τρόπο συλλογής των δεδομένων που απαιτούνται για την εκπαίδευση: χρησιμοποιώντας ένα iPhone κολλημένο σε ένα ραβδί, το είδος που χρησιμοποιείται συνήθως για τη συλλογή απορριμμάτων. Έπειτα ρύθμισαν το iPhone να καταγράφει βίντεο με το τι συνέβαινε.

Κρίσιμα δεδομένα

Εθελοντές σε 22 σπίτια στη Νέα Υόρκη ολοκλήρωσαν ορισμένες εργασίες χρησιμοποιώντας το ραβδί, όπως το άνοιγμα και το κλείσιμο θυρών και συρταριών, το άναμμα και το σβήσιμο των φώτων και η τοποθέτηση χαρτομάντιλων στα σκουπίδια. Τα συστήματα lidar, οι αισθητήρες κίνησης και τα γυροσκόπια των iPhones χρησιμοποιήθηκαν για την καταγραφή δεδομένων σχετικά με την κίνηση, το βάθος και την περιστροφή – σημαντικές πληροφορίες όταν πρόκειται για την εκπαίδευση ενός ρομπότ να αναπαράγει τις ενέργειες από μόνο του.

Αφού συνέλεξαν συνολικά βίντεο διάρκειας μόλις 13 ωρών, η ομάδα χρησιμοποίησε τα δεδομένα για να εκπαιδεύσει ένα μοντέλο τεχνητής νοημοσύνης για να δώσει οδηγίες σε ένα ρομπότ πώς να εκτελεί τις ενέργειες. Το μοντέλο χρησιμοποίησε τεχνικές αυτοεποπτευόμενης μάθησης, οι οποίες διδάσκουν στα νευρωνικά δίκτυα να εντοπίζουν μοτίβα σε σύνολα δεδομένων από μόνα τους, χωρίς να καθοδηγούνται από επισημασμένα παραδείγματα.

Το επόμενο βήμα

Το επόμενο βήμα περιελάμβανε τη δοκιμή του κατά πόσο ένα εμπορικά διαθέσιμο ρομπότ ήταν σε θέση να χρησιμοποιήσει το σύστημα AI για να εκτελέσει τις εργασίες. Το ρομπότ ονομάζεται Stretch και αποτελείται από μια μονάδα με τροχούς, έναν ψηλό στύλο και έναν πτυσσόμενο βραχίονα. Ένα iPhone προσαρτήθηκε στον βραχίονα του Stretch.

Οι ερευνητές δοκίμασαν το ρομπότ σε 10 σπίτια στη Νέα Υόρκη για 30 ημέρες και ολοκλήρωσε 109 οικιακές εργασίες με συνολικό ποσοστό επιτυχίας 81%. Κάθε εργασία χρειάστηκε συνήθως περίπου 20 λεπτά εκμάθησης από το Dobb-E: πέντε λεπτά επίδειξης από έναν άνθρωπο που χρησιμοποιεί το συνδεδεμένο iPhone, ακολουθούμενα από 15 λεπτά προσαρμογής, όταν το σύστημα συνέκρινε την προηγούμενη εκπαίδευσή του με τη νέα επίδειξη.

Απλές εργασίες

Μόλις ολοκληρώθηκε η προσαρμογή, το ρομπότ ήταν σε θέση να ολοκληρώσει απλές εργασίες, όπως να ρίχνει τσάι σε ένα φλιτζάνι, να ανοίγει περσίδες και κουρτίνες μπάνιου ή να τραβάει κουτιά επιτραπέζιων παιχνιδιών από ένα ράφι. Μπορούσε επίσης να εκτελέσει πολλαπλές ενέργειες σε γρήγορη διαδοχή, όπως η τοποθέτηση ενός κουτιού σε μια σακούλα ανακύκλωσης και στη συνέχεια η ανύψωση της σακούλας.

Ωστόσο, δεν στεφόταν κάθε προσπάθεια με επιτυχία. Το σύστημα μπερδεύτηκε από ανακλαστικές επιφάνειες σαν καθρέφτες. Επίσης, επειδή το κέντρο βάρους του ρομπότ είναι χαμηλό, εργασίες που απαιτούσαν να τραβήξει κάτι βαρύ σε ύψος, όπως το άνοιγμα της πόρτας ενός ψυγείου, αποδείχθηκαν πολύ επικίνδυνες για να τις επιχειρήσει.

Documento Newsletter