Grosse Sprachmodelle wie #ChatGPT brauchen viele Daten: Wenn Kinder so ineffizient lernen würden, müsste man tausende von Jahren unablässig an sie heranreden, bis sie halbwegs sinnvoll antworten könnten.
Diese Daten kommen aber auch aus zweifelhaften, unethischen und sogar illegalen Quellen. Mehr über die dunkle Herkunft der #Trainingsdaten, wie man diese entlockt und was das für #Privatsphäre etc. heisst bei #DNIP.
📰 https://dnip.ch/2024/01/12/die-dunklen-daten-geheimnisse-der-ki/
🧵 https://waldvogel.family/@marcel/111742467434816695