Η Microsoft παρουσίασε τρία νέα μοντέλα τεχνητής νοημοσύνης ικανά να παράγουν κείμενο, φωνή και εικόνα, ενισχύοντας τη στρατηγική της για ανάπτυξη δικής της τεχνολογικής βάσης στον ταχέως αναπτυσσόμενο χώρο της γενετικής AI. Τα νέα μοντέλα εντάσσονται σε μια ευρύτερη προσπάθεια της εταιρείας να ανταγωνιστεί άλλες μεγάλες πλατφόρμες, όπως η Google και η OpenAI, παρά τη στενή συνεργασία που διατηρεί με τη δεύτερη.

Διαβάστε: Σε λίγους μήνες η τεχνητή νοημοσύνη θα ξεπεράσει όλους τους ειδικούς σε κάθε επιστημονικό κλάδο μαζί: Τι σημαίνει αυτό

Συγκεκριμένα, το MAI-Transcribe-1 μετατρέπει ομιλία σε κείμενο σε 25 γλώσσες και, σύμφωνα με την εταιρεία, είναι σημαντικά ταχύτερο από υφιστάμενες υπηρεσίες της. Το MAI-Voice-1 επιτρέπει τη δημιουργία ηχητικού περιεχομένου, δίνοντας τη δυνατότητα παραγωγής έως και 60 δευτερολέπτων ήχου μέσα σε ένα δευτερόλεπτο, καθώς και τη δημιουργία εξατομικευμένων φωνών. Το MAI-Image-2 αφορά την παραγωγή οπτικού περιεχομένου, επεκτείνοντας τις δυνατότητες της πλατφόρμας σε πολυτροπικά μοντέλα.

Μicrosoft: Επιδιώκει την ανάπτυξη ανθρωποκεντρικής τεχνητής νοημοσύνης

Τα εργαλεία αναπτύχθηκαν από την ερευνητική ομάδα MAI Superintelligence, υπό την καθοδήγηση του Μουσταφά Σουλεϊμάν, και διατίθενται μέσω των πλατφορμών Microsoft Foundry και MAI Playground, όπου οι χρήστες μπορούν να δοκιμάσουν και να αξιοποιήσουν τις δυνατότητές τους. Ο Σουλεϊμάν ανέφερε ότι η εταιρεία επιδιώκει την ανάπτυξη «ανθρωποκεντρικής» τεχνητής νοημοσύνης, με έμφαση στη χρηστικότητα και την προσαρμογή στις πραγματικές ανάγκες των χρηστών.

Η Microsoft εκτιμά ότι ένα από τα βασικά πλεονεκτήματα των νέων μοντέλων είναι το χαμηλότερο κόστος σε σχέση με ανταγωνιστικές λύσεις, σε μια αγορά όπου ο ανταγωνισμός εντείνεται και οι επιχειρήσεις αναζητούν πιο αποδοτικές επιλογές.

Παράλληλα, η εταιρεία διατηρεί τη στρατηγική συνεργασία της με την OpenAI, στην οποία έχει επενδύσει περισσότερα από 13 δισ. δολάρια, ενώ φιλοξενεί τα μοντέλα της σε ευρύ φάσμα προϊόντων. Σύμφωνα με τη διοίκηση, η ανάπτυξη ιδιόκτητων μοντέλων δεν αναιρεί τη συνεργασία, αλλά ενισχύει τη συνολική της παρουσία στον χώρο της τεχνητής νοημοσύνης.

Η κίνηση αυτή εντάσσεται σε μια ευρύτερη τάση μεταξύ μεγάλων τεχνολογικών εταιρειών να αναπτύσσουν παράλληλα δικές τους υποδομές και συνεργασίες, σε μια αγορά που εξελίσσεται ταχύτατα και αποκτά όλο και μεγαλύτερη στρατηγική σημασία.