Snakken AI-chatbots ook naar de kerstvakantie? Onderzoek na klachten over ‘luie’ ChatGPT
Nu het jaar ten einde loopt, snakken de meeste mensen naar de kerstvakantie. En misschien doen we het alvast wat rustiger aan op het werk. Maar geldt dat ook voor apps die functioneren met artificiële intelligentie? Sommige gebruikers van de populaire taalrobot ChatGPT denken van wel. Experten doen nu onderzoek en ook moederbedrijf OpenAI neemt de klachten serieus.
Steeds meer gebruikers van de nieuwste (betaalde) versie van ChatGPT (model GPT4) klagen dat de chatbot kortere antwoorden geeft, weigert te doen wat mensen vragen, of zelfs werk bij de gebruikers teruglegt. Ook de toon die ChatGPT soms aanslaat, wordt door sommige gebruikers als brutaal of lui ervaren. Andere mensen vragen zich zelfs af of de chatbot misschien last heeft van een winterdepressie. Dat melden onder andere technologiesites ‘Ars Technica’ en ‘The Verge’.
Een programmeur nam de som op de proef en gaf ChatGPT 477 opdrachten, waarbij hij qua invoer alleen de maand veranderde. Hij stelde vast dat de taalrobot een langer antwoord gaf (gemiddeld 4.298 tekens) wanneer deze te horen kreeg dat het mei was, dan wanneer het december was. In dat geval antwoordde ChatGPT met gemiddeld 4.086 tekens. Verschillende onderzoekers proberen sindsdien dat onderzoek na te bootsen, maar ontdekten vooralsnog geen significante verschillen. Dat zou aan de onderzoeksopzet kunnen liggen, dus wordt gewerkt aan een andere manier om het vermeende fenomeen te onderzoeken.
Sommige gebruikers denken dat moederbedrijf OpenAI de chatbot simpelweg opzettelijk lui heeft gemaakt om de systemen van het bedrijf minder te belasten. Daar is volgens OpenAI geen sprake van, en men zegt de feedback van gebruikers zeer serieus te nemen: “We hebben al jullie reacties gezien over het steeds luier worden van GPT4! We hebben het model sinds 11 november niet meer bijgewerkt, en dit is zeker niet de bedoeling. Het gedrag van het model kan onvoorspelbaar zijn en we onderzoeken of we dit kunnen oplossen”, schreef het officiële account van de chatbot een kleine week geleden op X (voorheen Twitter).
Hoewel de mensen achter ChatGPT niet denken dat het model zichzelf heeft veranderd sinds de update van 11 september, sluiten ze niet uit dat er subtiele verschillen kunnen zijn bij een aantal opdrachten of vragen. Het kan volgens het bedrijf een tijdje duren voordat die kleine verschillen überhaupt als patronen worden opgemerkt door klanten, waardoor het ook even kan duren voordat werknemers aanpassingen kunnen maken in het model.
Winterdepressie
Verschillende programmeurs en AI-experten doen momenteel dan ook volop onderzoek naar de ‘luiheidshypothese’. Dat zelfs een winterdepressie van de chatbot door gebruikers niet wordt uitgesloten, komt doordat ook de invoer van mensen door de ChatGPT wordt gebruikt om te leren. Als gebruikers last hebben van een winterdepressie, dan zouden ze die ongewild door hun invoer kunnen overdragen aan de chatbot, menen sommige gebruikers.
Het zou ook te maken kunnen hebben met de manier waarop we opdrachten aan de chatbot geven. Hoeveel moeite steken we zelf nog in het duidelijke opdracht geven aan software die draait op kunstmatige intelligentie?Het geven van concrete instructies (“Leg stap voor stap uit...”) kan betere resultaten opleveren dan “Zeg me hoe...” Weer andere gebruikers gebruiken trucjes om hun favoriete chatbot te stimuleren betere antwoorden te geven. Soms door simpelweg te liegen dat ze geen vingers hebben, in andere gevallen door de chatbot een fooi te beloven. Ook een meer menselijke benadering, met aanmoedigingen als “adem diep in”, zouden betere resultaten opleveren, zeggen weer andere gebruikers.
Ten slotte zou ook onze verbeelding een rol kunnen spelen. Nu her en der berichten opduiken over een luie taalrobot, zijn we misschien kritischer gaan kijken naar de antwoorden van ChatGPT.
Maar wat als we het de applicatie zelf vragen? Die ontkent in alle toonaarden minder hard te werken in deze periode van het jaar: “Als een machine learning model ben ik niet onderhevig aan vermoeidheid, luiheid of seizoensinvloeden”.
Lees ook:
Gratis onbeperkt toegang tot Showbytes? Dat kan!
Log in of maak een account aan en mis niks meer van de sterren.Lees Meer
-
gamereview
‘Children of the Sun’ heeft maar één troefkaart, maar speelt die meesterlijk
-
PREMIUM39
41 foto’s zonder dat je je ervan bewust was: gezichtsherkenning op 10 Miles maakt indruk, maar mag dat zomaar?
De 10 Miles loopt u voortaan maar beter van start tot finish met een brede glimlach op uw gezicht. Want ook te midden van 30.000 lopers wordt u feilloos herkend. Een gespecialiseerd fotobedrijf levert tegen betaling tientallen persoonlijke foto’s van uw prestatie - souvenirs dankzij automatische gezichtsherkenning. Straf, maar ook wel een beetje creepy. Kan dit eigenlijk zomaar, privacygewijs? En moeten we deze technologie vrezen? -
PREMIUM
“Boetes tot 25.000 euro”: ben je echt strafbaar als je de nieuwe eigenaar van je wagen bespiedt in een app?
Je kan je oude wagen soms nog tot jaren na de verkoop traceren, via de app van de fabrikant. Dat ontdekte onze techjournalist. Hij kon nagaan waar de nieuwe eigenaar woonde en waar hij heen reed, en veel Vlamingen hebben diezelfde mogelijkheid. Is het niet strafbaar om een ander zo te bespieden? Advocaat Jens Vanhellemont verheldert, want je bent sneller aan het hacken dan je denkt. -
-
ING: "Artificiële intelligentie beïnvloedt job van twee op de drie Belgische werknemers”
-
Livios
Groen, rood, blauw of geel: richt je dak klimaatvriendelijk in met deze slimme tips
Een plat dak kan zo veel meer zijn dan louter de overkapping van je woning. Als je er een klimaatdak van maakt, kan het namelijk ook deel van de oplossing zijn om de klimaatverandering tegen te gaan - of leefbaarder te maken. Wat dat concreet betekent? Bouwsite Livios vraagt het aan Marc Dillen, directeur-generaal van Embuild Vlaanderen. -
gamereview
'Stellar Blade' werd fel gehypet, maar dit fonkelende mes had nog wat geslepen moeten worden
Als je ‘Stellar Blade’ opstart en in de instellingen duikt, vind je daar een optie om de paardenstaart van hoofdpersonage EVE kort of lang te maken. Dat heeft buiten het cosmetische effect geen enkele impact op het spel zelf, maar blijkbaar vonden de makers het belangrijk om je die keuze te geven. Bizar dan dat die paardenstaart in kwestie er tijdens het spelen uitziet als stukken droge spaghetti die met elastiekjes aan elkaar zijn geplakt. Lange of korte stukken droge spaghetti, naar eigen voorkeur. En dat is jammer genoeg een voorteken voor het hele spel dat voor elk leuk idee ook meteen een minpunt presenteert. -
gamereview
Met game ‘Tales of Kenzera: ZAU’ is het eindelijk ‘time for Africa’
-
1 op de 3 Vlaamse bedrijven gebruikt artificiële intelligentie
-
Duolingo-mascotte Duo lijkt plots depressief: wat is er aan de hand?
Duolingo-fans maken zich zorgen nu de mascotte van de app, de groene uil Duo, er depressief en verouderd uitziet. De Amerikaanse app, waarmee je op een speelse manier online een andere taal kunt leren, gebruikt Duo om herinneringen te sturen naar gebruikers om hun taallessen te voltooien. Maar waarom is het uiltje zo triest? -
Spaargids.be
Wat mag jij wel/niet doen met het geld op de rekening van je kind?
Het is de vrees van heel wat ouders: je hebt jarenlang flink voor je kinderen gespaard, maar eens ze 18 zijn, doen ze het verzamelde geld meteen op. En dan niet per se aan - in jouw ogen alvast - nuttige zaken. Hoe kan je dit vermijden? Spaargids.be geeft advies. -
Independer
Van 30 tot ruim 100 euro: dit kan je jaarlijks besparen als je je decoder afdankt en tv-kijkt via een app