سورس کد های Yandex که گفته میشه توسط یکی از کارمندان سابق این کمپانی به سرقت رفته بود ، بصورت عمومی در یکی از فروم های فروش داده قرار گرفت.
این کدها با عنوان Yandex git sources منتشر شده و در حدود 44.7 گیگ حجم دارن . فایلها متعلق به ژوئیه 2022 هستن و شامل رولهای ضد اسپم هم هستش.
Arseniy Shestakov محصولاتی که لیک شدن رو لیست کرده :
Search Engine and Indexing Bot
Maps – Like Google Maps and Street View
Alice – AI assistant like Siri / Alexa
Taxi – Uber-like taxi service
Direct – Ads service like Google Ads / Adwords
Mail – Mail service like GMail
Disk – File storage service like Google drive
Market – Marketplace like Amazon
Travel – Like a Booking.com plus Airplane, Train and Bus tickets
Yandex360 – Like Google Workspaces for services on your own domain
Cloud – Probably not all infrastructure code was leaked.
Pay – Payment processing like Stripe, but with limited set of features
Metrika – Like Google Analytics
همچنین ایشون لیستی از فایلهای لیک شده رو هم اینجا لیست کرده که اگه علاقمند بودید میتونید مشاهده کنید.
طبق آنالیز ایشون ، بطور کلی موارد زیر داخلشون هستش:
- کلیدهای API خاصی تو داده ها نیست . یه چند مورد هستش که اونم برای موارد تست هستش و کاربردی نداره.
- فقط محتوای مخرن گیت هست
- تاریخچه git توش نیست
- فایل باینری فقط برا چند مورد هستش
- تقریبا هیچ مدل ML آموزش دیده ای در داده ها نیست.
- تاریخ فایلها به 24 فوریه 2022 (جنگ روسیه با اوکراین) بازنویسی شدن
Yandex این داده هارو تایید کرده و گفته که سیستمشون هک نشده و این داده ها توسط یه کارمند ناراضی به بیرون درز کرده. همچنین تو این افشا داده های مرتبط با کاربران و حریم خصوصیشون منتشر نشده.
همچنین گفته که کدهای افشا شده با کدهای فعلی متفاوت هستن. در ادامه هم گفته که دارن روی نحوه استخراج هم تحقیق میکنن و این افشا خللی در ارائه سرویس هاشون نداشته.
آقای Grigory Bakunov که قبلا مدیر ارشد و معاون توسعه و مدیر توسعه فناوری Yandex بوده هم اعلام کرده که انگیزه این افشا سیاسی هستش و کارمند سابق این داده ها رو به رقبا نفروخته.
ایشون گفته که کد افشا شده با کد فعلی متفاوت هست اما ممکنه مثلا 90 درصد مشابه باشه و 10 درصد متفاوت باشه. همچنین داده های افشا شده شامل مدل شبکه عصبی و … نیست و صرفا کد هست و این داده ها زیاد جذاب نیست.
در بین داده های افشا شده یسری فایل با نامهای blacklist.txt هستش که میتونه سرویس های داخلی مورد استفاده Yandex رو افشا کنه که هکرها از اون برای حملات بعدی استفاده کنن.