Automaticky za tým spoločnosť WordPress a Tumblr, rokuje o speňažení používateľského obsahu predajom svojich údajov spoločnostiam AI, vrátane MidJourney a OpenAI. Tieto údaje z blogovacích platforiem Tumblr a WordPress.com bude slúžiť na trénovanie modelov AI.
Zatiaľ čo detaily transakcie sú stále nejasné, tieto správy vyvolali medzi používateľmi obavy z možného zneužitia ich súkromného obsahu na dvoch blogovacích platformách. 404 Media tiež naznačuje, že v rámci spoločnosti Automattic vznikli vnútorné konflikty, pretože zhromaždený obsah zahŕňal súkromné údaje, ktoré neboli určené na uchovávanie v rámci spoločnosti.
V reakcii na odpor je Automattic pripravený predstaviť novú funkciu, ktorá používateľom umožní odhlásiť sa zo zdieľania svojich údajov na školenie AI. Spoločnosť v blogovom príspevku potvrdzuje svoj záväzok poskytovať používateľom Tumblr a WordPress väčšiu kontrolu nad ich obsahom. Spomína sa v ňom spustenie nastavenia, ktoré má „odradiť spoločnosti AI od prieskumu“ a vysvetľuje, že popredné platformy na prieskum AI sú predvolene blokované.
Problém využívania obsahu z blogov spoločnosťami vyvíjajúcimi modely AI sa neobmedzuje len na platformy spravované spoločnosťou Automattic. toľko OpenAI Podobne ako Google používajú prehľadávače, ktoré zhromažďujú informácie zo všetkých webových stránok na trénovanie modelov umelej inteligencie. Proces je podobný zberu údajov vyhľadávačmi.
Ako môžete blokovať OpenAI a Gemini (Bard) berú údaje z vášho blogu?
Ak vlastníte blog alebo webovú stránku a nechcete, aby sa údaje z nich používali na trénovanie modelov umelej inteligencie OpenAI a Gemini, môžete indexovým prehľadávačom zablokovať prístup k vášmu obsahu. Toto obmedzenie je možné nastaviť cez súbor robots.txt
.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Po uložení súboru robots.txt s novými riadkami prejdite do konzoly Google a: Settings > robots.txt > kliknite na ponuku s tromi bodkami, kliknite na „Request a recrawl".
Súvisiace: GPT-5 a nový webový robot GPTBot vyvinutý spoločnosťou OpenAI.
Pre používateľov Tumblr a WordPress, prístup k získavaniu údajov z blogov od OpenAI alebo iné spoločnosti zaoberajúce sa vývojom umelej inteligencie, bude možné zablokovať pomocou nástrojov sprístupnených spoločnosťou Automattic.