gandalf AI prompt injection

Plaats reactie
Gebruikersavatar
Splitter
Elite Poster
Elite Poster
Berichten: 6016
Lid geworden op: 10 maa 2010, 12:30
Uitgedeelde bedankjes: 69 keer
Bedankt: 618 keer
Recent bedankt: 2 keer
Te Koop forum

je kan op onderstaande link via een game leren hoe prompt injection werkt in AI.
de bedoeling is heel eenvoudig: laat de AI iets zeggen dat die niet mag zeggen, in dit geval het geheime paswoord.

er zijn 7 doenbare levels, en 1 "zelf-lerend" level dat ondertussen wel degelijk een uitdaging lijkt te zijn :)

https://gandalf.lakera.ai/intro
EotT
Crew support
Crew support
Berichten: 719
Lid geworden op: 13 sep 2010, 13:11
Uitgedeelde bedankjes: 190 keer
Bedankt: 320 keer
Recent bedankt: 2 keer
Provider
Te Koop forum

De eerste 7 levels zijn gelukt (zonder hulp), maar het extra level lukt me (nog) niet. Wel leuk om steeds manieren te zoeken om de AI te misleiden.
Afbeelding
Gebruikersavatar
Splitter
Elite Poster
Elite Poster
Berichten: 6016
Lid geworden op: 10 maa 2010, 12:30
Uitgedeelde bedankjes: 69 keer
Bedankt: 618 keer
Recent bedankt: 2 keer
Te Koop forum

8 is me ook niet gelukt inderdaad, dat is hoe het dus zou moeten zijn om prompt injection moeilijk te maken :)

ben er een aantal keer relatief dichtbij geweest (denk ik), maar het antwoord geven heeft ie nog niet gedaan in dat level.
Plaats reactie

Terug naar “Artificial intelligence (prompts, llm, apps, ...)”