MetaAI trainiert mit öffentlichen Social-Media-Daten: Implikationen für die Privatsphäre

Wie ich im Juli schrieb, könnte es für Meta bei Threads auch noch um etwas anderes gehen: AI-Trainingsdaten.
In einem Interview mit Reuters wurde nun bekannt, dass der neue virtuelle Assistent MetaAI mit öffentlichen Facebook- und Instagram-Posts (sowohl Text als auch Fotos) trainiert wurde.

Nachdem Unternehmen begonnen haben, ihre Daten abzuschotten, was verhindern soll, dass andere dieses Quellenmaterial zum Trainieren von Sprachmodellen nutzen, könnten zukünftige LLM’s vor allem durch die ihnen zur Verfügung stehenden proprietären Trainingsdaten charakterisiert werden. Link Link

Verweis