افراد در دنیای مجازی تمایل دارند نه فقط با کلمات بلکه با تصاویر نیز ارتباط برقرار کنند. این امر برای یک پلتفرم مانند فیسبوک با بیش از 2 میلیارد کاربر فعال ماهانه، بدان معنی است که تعداد زیادی از تصاویر هر روز در این بستر ارسال میشوند.فیسبوک برای نظارت بر این تصاویر که شامل متن هستند و برای آن که مطمئن شود حاوی سخنان مستهجن یا نفرتپراکنانه و نژادپرستانه نیستند و در چهارچوب قوانین فیسبوک قرار دارند، یک سیستم یادگیری ماشین بزرگ به نام "روزتا"(Rosetta) ایجاد کرده است.فیسبوک نیاز به یک سیستم تشخیص کاراکتر نوری داشت که بتواند به طور منظم حجم زیادی از محتواها را پردازش کند. بنابراین باید فناوری مخصوص خود را توسعه میداد.با توجه به هویت این شبکه اجتماعی، "روزتا" متون بیش از یک میلیارد تصویر و فریمهای ویدیویی را که به زبانهای متنوع نوشته شدهاند در زمان واقعی استخراج و ترجمه میکند.فیسبوک در یک پست جدید نحوه کار روزتا را اینگونه توضیح داد: روزتا با تشخیص قابهای مستطیلی که قابلیت حاوی متن بودن را دارند، آغاز میکند. سپس با استفاده از یک شبکه عصبی به شناسایی و رونویسی آنچه که در آن منطقه نوشته شده، حتی کلمات غیرانگلیسی یا حروف غیر لاتین مانند عربی و هندی میپردازد.
فیسبوک برای آموزش این سیستم، از ترکیب تصاویر به اشتراک گذاشته شده توسط انسانها و ماشینها استفاده کرد.تیمهای مختلف در فیسبوک و اینستاگرام در حال حاضر از روزتا استفاده میکنند تا محتوای بیشتری را بررسی و سیستم عامل خود را کنترل کنند.این شرکت قصد دارد تا تعداد زبانهایی را که روزتا میتواند درک کند، افزایش دهد و کاری کنند تا در استخراج متن از فریمهای ویدئویی بهتر عمل کند.فیسبوک به تازگی 24 زبان جدید از جمله صربستانی، بلاروسی، مَراتی، سینهالی، تلوگو، نپالی، کانارا، اردو، پنجابی، کامبوجی، پشتو، مغولی، زولو، خوسایی و سومالیایی به سرویس ترجمه خودکار خود اضافه کرده است.فیسبوک تایید کرد که ترجمه برای این زبانها در مرحله اولیه است، بنابراین آنها هنوز هم خطاهای زیادی خواهند داشت. با این وجود، در نظر دارد تا آنها را بهبود بخشد و زبانهای بیشتری را در آینده معرفی کند.