WEBVTT

1
00:00:00.080 --> 00:00:08.680
Welkom bij AI Report, de Nederlandse podcast over kunstmatige intelligentie waar we uitzoeken welke invloed AI heeft op ons werk, ons leven en de samenleving.

2
00:00:08.720 --> 00:00:20.120
Met deze week: er is een enorme sprong op de belangrijkste test die meet hoe ver we zijn in de ontwikkeling van AGI. En dat is dus het idee dat computers 95% van het kenniswerk kunnen overnemen.

3
00:00:20.180 --> 00:00:32.060
Op die test, dat meten, uhm, gebeurt normaal een grote sprong naar voren als er een nieuw groot model van een AI-bedrijf uitkomt, zoals we recent zagen met Gemini 3 Pro van Google.

4
00:00:32.900 --> 00:00:40.980
Maar er is deze week ook zo'n enorme sprong gemaakt en dit keer komt het niet van een groot AI-bedrijf, maar van een startup van zes nerds. Daar gaan we het over hebben.

5
00:00:41.600 --> 00:00:51.070
Natuurlijk blijven nieuwe modellen wel gewoon uitkomen. We verwachten deze week GPT-5.2 in ChatGPT en Wytse is bij voorbaat al kritisch. Nou, dat ga je dadelijk horen.

6
00:00:51.080 --> 00:01:00.440
En we tippen een geweldige AI-tool die je nu al kunt inzetten om delen van je werk te automatiseren. Ik heb hem geprobeerd. Het is fantastisch. Dat en meer in AI Report. Veel plezier.

7
00:01:02.010 --> 00:01:20.140
[muziek] Wytse, ik volg dus op LinkedIn heel veel van die marketingmensen en die van reclamebureaus en die delen nu deze week allemaal stuk voor stuk achter elkaar hun kerstcommercials.

8
00:01:20.320 --> 00:01:30.480
Dat schijnt een ding te zijn inmiddels bij marketingbureaus. Waar zij aan meegewerkt hebben, die uit hun stal komen, zeg maar. Precies. En dat zijn dit jaar voorspelbaar genoeg veel met AI gegenereerde kerstcommercials.

9
00:01:30.520 --> 00:01:41.200
En gaat dat dan met trots of juist een beetje verstopt? Uh, nee, daar zit wel, daar zit enige mate van trots in. Ja, uh, we zagen het bij Coca-Cola als eerste natuurlijk.

10
00:01:41.520 --> 00:01:50.820
Dat was internationaal, maar ook in Nederland heeft McDonald's voor Nederland een met AI gemaakte kerstcommercial gemaakt. En wat ik, en dat is niet de enige. Er zijn er meer.

11
00:01:50.880 --> 00:01:54.720
Dit is dus een trend, zou je kunnen zeggen, met AI kerstcommercials maken.

12
00:01:55.220 --> 00:02:05.200
En ik vind het altijd grappig hoe ze erover praten op LinkedIn, want er wordt toch een beetje met omhalen wordt er dan bij gezegd, soort van: ja, we experimenteren en belangrijk om, uh, te innoveren.

13
00:02:05.250 --> 00:02:08.160
Dus, d-d-we, er worden wel wat kanttekeningen bij geplaatst, zeg maar.

14
00:02:08.220 --> 00:02:16.880
De, de kritiek is natuurlijk ook voorspelbaar, maar wat tegelijkertijd gebeurde was dat ik weer een ander reclamebureau zag die heel erg juist trots, uh, ging doen met het tegenovergestelde.

15
00:02:16.920 --> 00:02:25.200
Namelijk: wij hebben de hele commercial gemaakt met klei en stopmotion. Ja, Wallace en Gromit, van die iedere keer een klein fotootje en dat klei dingetje een klein beetje aanpassen.

16
00:02:25.220 --> 00:02:31.000
En als je het allemaal achter elkaar plakt, dan beweegt het. En dat kun je natuurlijk niet los zien van de tijdsgeest.

17
00:02:31.040 --> 00:02:38.100
En die andere reclamebureaus die allemaal AI-gegenereerde commercials aan het maken, maar dat je dus je kont tegen de krib gooit en dat je daarmee ook iets probeert te zeggen.

18
00:02:38.140 --> 00:02:49.640
Een soort van: kijk ons eens heel moeilijk gedaan hebben. En ik vind het een grappig, grappig moment in het tijdsgewricht. Want die kerstcommercials, die zijn allemaal, zijn wel oké.

19
00:02:50.400 --> 00:02:57.520
Uh, ik denk niet echt dat, uh, soort van we over 20 jaar er aan terug gaan denken: nou, dat was een leuke commercial die McDonald's maakte voor de kerst,

20
00:02:58.940 --> 00:03:08.560
maar het is ook weer niet slecht en het, je zit er als kijker toch naar te kijken en denk je: ja, oké, het is met AI gemaakt, dat zie ik zelf ook wel. Het wordt steeds beter, snap ik ook wel.

21
00:03:09.240 --> 00:03:17.100
Het is een beetje een raar moment dat, dat, dat dus met de hand dingen nu maken nu op een, op een of andere manier ook betekenis hebben. Het heeft zeggingskracht.

22
00:03:17.120 --> 00:03:24.740
Het is natuurlijk ook nog dat ik denk dat vanuit marketing, dat is volgens mij wat Coca-Cola deed, want dit is hun tweede of derde al volgens mij met AI gemaakt.

23
00:03:24.769 --> 00:03:35.900
Hij wordt dan ieder jaar een beetje beter qua output, qua kwaliteit. Ja. Uh, maar er zit ook een beetje in van: AI is nu het ding. Als we het met AI maken, dan is het nieuws dat het met AI gemaakt is.

24
00:03:35.940 --> 00:03:43.560
Het is een beetje, beetje, het is gewoon marketing, zeg maar. Precies, mensen gaan erover praten, daardoor. Ja, dus enga-, whatever the engagement is, engagement is engagement.

25
00:03:43.600 --> 00:03:52.580
Om het eventjes, uh, [gniffelt] op marketingniveau te zeggen. Ik vind wel, ik ben, ben dus wel benieuwd in hoeverre dat dan, dat trucje gaat op een gegeven moment niet meer werken.

26
00:03:52.860 --> 00:03:58.100
En, hè, als in: het is gewoon niet meer interessant. Dat het met AI gemaakt is. Nee, want dat, dat is nu interessant omdat het zo'n onderwerp is.

27
00:03:58.180 --> 00:04:07.460
Maar kan me voorstellen- En het nog wel een beetje moeilijk is om een commercial uit te maken. Trots zeggen van: moet je kijken wat ons desondanks de matige kwaliteit van de output toch gelukt is om te maken.

28
00:04:07.650 --> 00:04:18.060
Als een soort trots op met mindere middelen toch iets te doen. En het is AI en dat creëert die engagement. Maar aan, ik ben wel benieuwd, dat is niet houdbaar. Nee.

29
00:04:18.180 --> 00:04:29.620
Uh, in hoeverre de minder enthousiaste engagement hier omheen op een gegeven moment niet een soort van, uh, uh, hoe zeg je dat, de weegschaal een beetje doet, doet draaien weer. Kijk, nu kan je zeggen,

30
00:04:30.580 --> 00:04:39.120
ook al is er best wel een vocale groep mensen die zegt: ik doe liever kijken naar een, uh, reclame van, uh, kleipoppetjes, hè, want dat is artis- Dat voelt beter.

31
00:04:39.180 --> 00:04:45.620
Daar word je in je hart iets warmer van dan het idee dat er GPU-cycles hebben staan draaien. Precies. Het is een heel mooi contrast tussen die twee.

32
00:04:46.360 --> 00:04:56.840
Uhm, of dan niet de, ja, de, het anti-sentiment richting die AI-gegenereerde reclames op een gegeven moment zwaarder gaat wegen omdat de novelty, de nieuwheid, de innovatie- Is dit jouw voorspelling van volgend jaar?

33
00:04:56.920 --> 00:04:59.680
Volgend jaar zijn er geen AI-commercials. Ja, wacht even, dat weet ik niet.

34
00:04:59.720 --> 00:05:06.300
Maar ik kan me wel voorstellen dat ik, als je nu bij Coca-Cola zit, dan zitten daar ook mensen aan tafel die zeggen: moeten we dit niet juist niet doen? Ja.

35
00:05:06.340 --> 00:05:13.420
En waar een andere groep zegt- Dat is wat, d-dat die klei-commercial is. Ik kan daar niet anders, iets, niet iets anders in zien dan een statement. Absoluut een statement, ja.

36
00:05:13.840 --> 00:05:22.560
Maar dan is de vraag volgend jaar, als we VO4 hebben en, en die reclamebureaus allemaal weer voor diezelfde taak zitten: we moeten een kerstcommercial hebben waar mensen over gaan praten.

37
00:05:22.590 --> 00:05:25.810
Gaan we dan nog de moeite nemen om die klei-reclame met de hand te maken?

38
00:05:25.880 --> 00:05:37.168
Of is het, het feit dat er dan geen verschil meer zichtbaar is, even voorspellend dat dat het geval gaat zijnUh, is dat dan, uh, is het dan nog de moeite waard om met de hand een kleine commercial te maken als je het verschil echt niet meer ziet?

39
00:05:37.468 --> 00:05:43.778
Nou ja, dan kan, dan zou je nog de moeite waard kunnen zijn dat de making of video, dat is ook een beetje- Ja. Je hebt allemaal van die meta content tegenwoordig. Ja.

40
00:05:43.808 --> 00:05:55.468
Ik merk het bij mezelf ook dat ik het vaak, dit was vroeger al met DVD specials en extended director cuts, dat je het, dat ik het in ieder geval leuk vond om te luis-, de film nog een keer te kijken terwijl de, de, de, de director meekletst.

41
00:05:55.508 --> 00:06:04.048
Ja. Hè, dus die meta content, dat was altijd al een ding. Maar ik kan me voorstel-, dit zie je nu ook bij al die robotvideo's. Dan zijn er allemaal robotvideo's en dan moeten er video's gemaakt worden van de making of.

42
00:06:04.128 --> 00:06:13.088
En ik heb er laatst één gezien. Dat was de video van de making of making of. [lacht] Nee, nee, nou ja, serieus, want dat, het ging over dat, volgens mij ging een robot ging iemand in elkaar schoppen of zo.

43
00:06:13.168 --> 00:06:21.308
Best wel intens beeld, als in als, uh, reclame. Toen werd er een video uitgebracht. Die la-lag al klaar van de making of, omdat ze al dachten: dit gaat niemand geloven, zeg maar.

44
00:06:21.348 --> 00:06:27.268
Dat was om te laten zien dat je een soort boxer, de vechtende robot had. En toen lag er ook alweer een video klaar van het maken van de making of.

45
00:06:27.768 --> 00:06:37.367
En ik denk, [lacht] ik kan me wel voorstellen dat als er volgend jaar twee commercials uitkomen, allebei met kleipoppetjes. Ja. De een is VIO4 en de ander hebben mensen 4.000 uur in gestoken of zo.

46
00:06:37.448 --> 00:06:49.028
Of in ieder geval 400 minimaal. Ja. Dat dan bij die tweede er een making of en de making of van de making of bij moet om die weer gewicht te geven. Het blijft boeiend hoe we AI in onze cultuur gaan opnemen.

47
00:06:49.068 --> 00:06:57.728
Dat is een, uh, dat is een groot thema. Daar gaan we ongetwijfeld volgend jaar nog heel veel over praten. Dit jaar was AI Report opnieuw de best beluisterde podcast over AI van Nederland. Gefeliciteerd, Wytse.

48
00:06:57.848 --> 00:07:02.468
Ja, jij ook. Uh, daar zijn we heel trots op en het geeft ons ook energie om nieuwe plannen te maken voor volgend jaar.

49
00:07:02.548 --> 00:07:10.248
We hebben ruimte voor nieuwe sponsoren die zich willen verbinden aan onze podcast en aan onze luisteraars. En dat zijn, weten we uit ervaring, veelal beslissers uit het bedrijfsleven.

50
00:07:10.288 --> 00:07:18.948
Als je daar interesse in hebt, in dus sponsor worden van deze podcast, dan kun je de link checken in de omschrijving en dan videobellen wij snel. We gaan naar het nieuws, Wytse.

51
00:07:21.548 --> 00:07:34.748
[muziek] Want in strijd met Google parkeert OpenAI de nieuwste snufjes en focust het weer op wat er toe doet: de volgende update van grote modellen. En er komt nu eerst een kleine update als tussenversie.

52
00:07:34.968 --> 00:07:45.348
GPT-5.2 kun je verwachten en die wordt waarschijnlijk naar voren gehaald. Zo gaan de geruchten. Oorspronkelijk gepland voor eind december, maar nu waarschijnlijk al deze week. Misschien zelfs wel als je dit luistert.

53
00:07:45.648 --> 00:07:57.548
OpenAI testte recent reclame in ChatGPT. Dat is dus een gebrek aan focus, uh, denkt Sam Altman nu. Uh, betalende gebruikers gingen gelijk klagen en die functie is daarop uitgezegd, uitgezet.

54
00:07:57.568 --> 00:08:04.708
En het valt allemaal een beetje samen met die intern afgekondigde code rood bij OpenAI in verband met de strijd met Google.

55
00:08:05.128 --> 00:08:15.068
Dat betekent dus ook dat die advertentieplannen in ChatGPT, uh, naar de lange baan zijn geschoven tot de basis eerst op orde is. Claude Code komt naar Slack.

56
00:08:15.128 --> 00:08:20.588
Dat is een, uh, Claude Code is een vibe coding tool, gebouwd op het razend populaire AI-model Claude.

57
00:08:21.148 --> 00:08:28.038
En vibe coding betekent natuurlijk dat je samen met AI kunt programmeren door gewoon te beschrijven wat je wil, in plaats van dat je per se moet kunnen programmeren.

58
00:08:28.068 --> 00:08:33.548
En nu komt er dus deze functionaliteit naar een programma dat heel veel mensen gebruiken op hun werk.

59
00:08:33.608 --> 00:08:42.348
Je kunt in een chat met een collega dan zeggen dat je iets wil debuggen en dan Claude erbij taggen zoals je normaal een collega tagt en dan pakt het model dat voor je op.

60
00:08:42.848 --> 00:08:48.728
En dat is misschien belangrijker dan dat het klinkt, want het toont hoe AI integreert in onze alledaagse programma's.

61
00:08:49.288 --> 00:09:00.408
Andere populaire tools zoals Cursor en GitHub Copilot bieden ook al Slack integraties en de strijd gaat hier niet meer over welk model het beste is, maar wie het beste en het diepst integreert in de workflow die je al gebruikt.

62
00:09:01.628 --> 00:09:09.568
Een zeskoppig bedrijf genaamd Poetic is als eerste ter wereld door de 50%-grens gebroken op de ARC-AGI2 Challenge.

63
00:09:09.618 --> 00:09:21.568
Dat is een test die binnen de AI-wereld geldt als de ultieme lakmoesproef voor menselijk, uh, intelligentie, uh, niveau. De test meet waar AI slecht in is en waar mensen juist goed in zijn.

64
00:09:21.988 --> 00:09:28.228
Nieuwe onbekende problemen oplossen zonder terug te vallen op voorbeelden waar, wat het ding eerder heeft kunnen zien.

65
00:09:28.948 --> 00:09:36.468
Zes maanden geleden scoorden de beste modellen nog onder de 5% en mensen halen daar ondertussen dus moeiteloos 60%. Voor mensen is het makkelijk, voor AI is het moeilijk.

66
00:09:37.308 --> 00:09:47.948
Maar het bijzondere is dat Poetic geen eigen model bouwde en toch de boel versloeg. Ze gebruikten Google's, uh, Gemini 3 Pro en maakten daar slimme software omheen.

67
00:09:47.968 --> 00:09:56.888
En het resultaat is dat het beter scoort op die belangrijke test dan Google's eigen topvariant. Voor ook nog eens de helft van de kosten.

68
00:09:56.908 --> 00:10:06.148
En dat laat zien dat vooruitgang op dit moment niet alleen komt van bedrijven die miljarden uitgeven aan het trainen van nieuwe modellen, maar ook door dit soort slimme zetten van kleine groepjes nerds.

69
00:10:06.288 --> 00:10:18.808
We gaan het er straks uitgebreid over hebben. En Anthropic, OpenAI en Block bundelen hun krachten voor open AI-standaarden. Zo maakte Anthropic deze week bekend. Het bedrijf doneert het Model Context Protocol.

70
00:10:18.868 --> 00:10:31.148
Dat is een universele standaard waarmee AI-applicaties met elkaar of externe systemen kunnen communiceren. Aan een foundation, een stichting die valt onder de Line, uh, de Linux Foundation.

71
00:10:31.168 --> 00:10:41.668
Dat is een non-profit die open source projecten beheert en zorgt dat geen enkel bedrijf de controle krijgt. Het is allemaal heel, uh, uhm, gezellig. En de cijfers tonen aan waarom dit relevant is.

72
00:10:41.688 --> 00:10:54.268
Meer dan 10.000 actieve MCP-servers hebben we op dit moment. Het is een standaard die is geadopteerd door eigenlijk alle grote, uh, makers van taalmodellen en er worden ontzettend onwaarschijnlijk veel MCP-calls gedaan.

73
00:10:54.348 --> 00:11:08.687
Het is inmiddels een, nou ja, belangrijke bouwsteen voor hoe AI-systemen met externe software werken. En ook Google, Microsoft, AWS en Cloudflare, allemaal grote partijen, steunen dit initiatief.

74
00:11:08.708 --> 00:11:19.507
Dit is best wel cool, Wytse. Ja, en best wel snel gegaan, want onze MCP-aflevering is denk ik een jaar oud nu max. Ja, toch nog even: wat is MCP? Nou, je zou het HTTP kunnen noemen van, dan zeg jij: wat is HTTP?

75
00:11:19.548 --> 00:11:31.268
Ja, precies, het maakt niet beter. Taalafspraken tussen partijen, zodat je in dezelfde taal data naar elkaar kunt sturen. Het is een koppeling. Ja. Zodat je, zodat je bij-bijvoorbeeld in ChatGPT met Notion kan praten.

76
00:11:31.288 --> 00:11:40.747
Ja. Als je Notion gebruikt. Of Moneybird. Of Moneybird. Noem het maar op. Ja. En eigenlijk is het, we hadden dit al in de vorm van API's. Alleen API's waren bedacht voor ontwikkelaars om met externe systemen te praten.

77
00:11:40.788 --> 00:11:48.068
En hier gaat het om AI agents of AI-systemen die met externe systemen praten. En dan heb je ook nog wat meer veiligheid nodig.

78
00:11:48.348 --> 00:11:56.416
En het is gewoon prettig als je een beetje van elkaar weet hoe je dat doet, want dan kan jeVoor de eind eindgebruiker wat makkelijker die hele plug-in directory maken.

79
00:11:56.456 --> 00:12:03.466
Namelijk dat jij in ChatGPT kan zeggen: ik wil mijn Google Drive, ik wil mijn Canva, ik wil mijn dingetjes, mijn Figma. Ik wil icoontjes koppelen als een soort appstore.

80
00:12:03.476 --> 00:12:14.516
Het klinkt allemaal heel ingewikkeld, maar het heeft hele praktische, uh, gevolgen. Want daardoor kun je dus in je ChatGPT letterlijk vragen om de verwarming harder te zetten als je die koppeling maakt.

81
00:12:14.536 --> 00:12:26.336
Nou, dit was een protocol wat is bedacht door Anthropic. Die hebben dus, uh, ja, die zijn ermee begonnen en dat is heel snel overgenomen door grote concurrent OpenAI en Google.

82
00:12:26.516 --> 00:12:36.196
Ja, toen eigenlijk volgens mij, uh, was Google eerst, maar toen uiteindelijk één grote speler ook meedeed en op een gegeven moment is het eerst, het tweede schaap over de dam zou je moeten zeggen en dan gaat het hard.

83
00:12:36.436 --> 00:12:43.276
En dan gaat het nu ook nog eens in een open source foundation. Ik vind het verdacht, uh, ja. Ja, het is, nee, maar goed.

84
00:12:43.365 --> 00:12:49.376
Ik denk dat- Onvoorstelbaar dat deze grote commerciële bedrijven nu iets, een zo'n belangrijke standaard in een non-profit parkeren.

85
00:12:49.416 --> 00:12:59.036
Nou, misschien is goed, goede achtergrondinformatie is dat het A2A-protocol, namelijk agent to agent, wat door Google bedacht is, dat is weer bedacht om agents met elkaar te laten praten.

86
00:12:59.436 --> 00:13:09.536
Dat dat ook al in de, in de community gegooid was, zeg maar, of gezet was. Dus in essentie kan, zou je kunnen zeggen dat als Google dat schaakstuk naar voren schuift, dat Anthropic eigenlijk mee moet gaan schuiven.

87
00:13:09.936 --> 00:13:18.536
Dus, uh. Maar waarom doen ze dit? Nou, uiteindelijk is het in ieders voordeel. Het is, hè, het is, het is, je zou het een soort van positieve, uh, collusion kunnen noemen.

88
00:13:18.636 --> 00:13:22.576
Het is een soort van, uh, uh, samenwerken, uh, voor de markt.

89
00:13:22.636 --> 00:13:30.676
Omdat, als jij elkaars protocollen ondersteunt, zorgt dat ervoor dat de portabiliteit, dus het mee kunnen nemen van het één en het andere, uh, binnen het systeem groter wordt.

90
00:13:31.116 --> 00:13:38.156
En dat opent dan eigenlijk, hè, normaal dwingt de Europese Unie dit soort dingen af, hè. Dus ik denk dat jij ook een beetje verbaasd bent dat ze het zichzelf aan het opleggen zijn.

91
00:13:38.276 --> 00:13:48.466
Uh, ik bedoel, ik denk dat het, dat de voordelen om samen te werken tussen alle partijen en hun agents en hun developers en hun, uh. Groter is dan als ze het allemaal voor zichzelf zouden houden.

92
00:13:48.466 --> 00:13:59.536
De nadelen over— Ik bedoel, er zit een enorme lock-in neiging bij die grote partijen, hè, om te zeggen: uh, je hebt het, uh, nou, laten we voor het gemak Google nemen, die A2A, agent to agent maakt, helemaal beheert.

93
00:13:59.656 --> 00:14:06.696
En, uh, als je mee wil doen moet je naar Google luisteren, zeg maar. Dat is in hun voordeel, maar het is om het te laten adopteren door de industrie in hun nadeel.

94
00:14:06.736 --> 00:14:25.196
En je, je merkt gewoon dat voor jouw concurrenten om mee te doen aan jouw plan, dat dat in een non-profit stoppen en in dit geval zelfs onder een derde partij te leggen die best wel gewend is, de Linux Foundation bestaat al best wel lang, om, ja, een soort shepherding, hè, een soort herder te zijn van dit soort, uh, uh, afspraken.

95
00:14:25.276 --> 00:14:36.776
Ja, de Linux Foundation beheert de, ik neem aan de code achter Linux? Onder andere en heel veel standaarden daarin. Het gaat vooral om protocollen eigenlijk. Dus je hebt, uh, kijk, uiteindelijk is het implementaties.

96
00:14:37.076 --> 00:14:46.256
Dat is code. Dat mag je redelijk zelf weten hoe je het implementeert. Zijn ook wel een beetje regels over, maar het is vooral: hoe, wat kunnen we van jou verwachten? Als we met jou praten, wat zeg je dan terug?

97
00:14:46.536 --> 00:14:50.116
En als we deze 20 dingen aan jou vragen, verwachten we het ook in dit formaat terug.

98
00:14:50.396 --> 00:14:57.896
Het is bijna hartverwarmend hoe deze bedrijven bij elkaar gekomen zijn rond kerstdagen om te zeggen: weet je wat, we hebben hier iets heel waardevols in handen. We stoppen het in een non-profit.

99
00:14:57.916 --> 00:15:03.976
Luister, het hele internet is gebouwd op dat soort standaarden en die zijn vaak ook spontaan ontstaan en later, uh, in een werkgroep gegroeid.

100
00:15:04.076 --> 00:15:09.556
Alleen werkgroepen krijgen mensen vaak zenuwachtig van, omdat ze dan denken: nou, daar gaat MCP. Als in: dit staat nu voor altijd stil.

101
00:15:09.616 --> 00:15:16.996
Terwijl, dus, hè, als in, als het eenmaal een soort bureaucratisch, uh, democratisch proces is binnen een stichting, kan MCP dan nog doorgroeien?

102
00:15:17.016 --> 00:15:22.636
Hè, want toen alleen Anthropic het deed, waren het misschien vijf mensen bij Anthropic. Hè, dat gaat een stuk harder. Ja, ja, nu moeten ze maar overleggen.

103
00:15:22.836 --> 00:15:30.936
Ja, maar je zou ook kunnen zeggen: als je eenmaal op de 1.0 bent, hè, dus alle, de foundations, de fundamenten liggen, dan is er een moment dat je het overdraagt.

104
00:15:30.976 --> 00:15:41.196
Nou, er is nog meer hartverwarmends, namelijk Marjan en Lucas van Dept. [muziek] Hi, hier marketing- en techbureau Dept. Elke week bespreken we hoe wij merken helpen in de wondere wereld van AI.

105
00:15:41.696 --> 00:15:51.316
Deze week gaan we het hebben over AI guardrails om consumenteninput te controleren op niet-toegestane inhoud, zodat we AI veilig kunnen gebruiken in hun merkervaring. Lucas, vertel.

106
00:15:51.676 --> 00:15:59.316
Ja, nou, je moet er niet aan denken dat iemand bijvoorbeeld met je chatbot begint te praten, uh, en daar zijn, uh, politieke voorkeuren begint te venten en jouw chatbot een vrolijk gesprek daarover begint.

107
00:15:59.796 --> 00:16:09.656
Nou, om die reden hebben we voor een wereldwijd FMCG-merk een oplossing gebouwd die ervoor zorgt dat AI consumenten één op één kan helpen, maar wel allemaal binnen de veilige merkconforme grenzen.

108
00:16:09.696 --> 00:16:19.936
Interessant, want het gaat best wel vaak fout nog toch? Ja, we kennen allemaal de voorbeelden van AI's die beginnen te hallucineren of, uh, uh, uh, iets te ver meegaan met iemands, uh, uh, politieke mening bijvoorbeeld.

109
00:16:20.436 --> 00:16:28.156
Uh, en dat is niet gek, want je hebt gewoon weinig controle natuurlijk over wat consumenten allemaal kunnen invoeren. Denk bijvoorbeeld aan scheldwoorden, gevoelige data of politieke statements die we net al noemden.

110
00:16:28.196 --> 00:16:32.916
En die wil je gewoon niet in je merkervaring hebben. Uhm, daarom hebben we AI guardrails ontwikkeld.

111
00:16:32.956 --> 00:16:42.496
Eigenlijk is het een laag van slimme controles die je over het inputveld legt en die kijkt realtime of wat er gezegd wordt, uh, uh, wel of niet binnen de, uh, de guardrails valt.

112
00:16:42.556 --> 00:16:52.776
En pas als die het sein 'veilig' geeft, gaat de rest van de AI aan de slag met het, uh, formuleren van het antwoord, waardoor we ervoor kunnen zorgen dat het supermenselijk is, één op één, maar ook veilig. Check.

113
00:16:53.216 --> 00:16:59.816
Hé, en kunnen merken dit makkelijk toepassen ook? Ja, het vraagt natuurlijk altijd werk, hè. Te beginnen met dat je moet bepalen wat wel of niet mag.

114
00:16:59.856 --> 00:17:09.656
Nou, ik denk dat 90%, uh, logisch is wat niet mag, maar er is altijd die laatste 10%. Denk aan, uh, welke concurrent je wel of niet wil meenemen, et cetera. Uhm, dan ontwikkelen we of trainen we het model.

115
00:17:09.716 --> 00:17:14.156
Dat moeten we een aantal keer testen, uh, maar het goede is: de tech is volwassen en ook heel goed te trainen.

116
00:17:14.176 --> 00:17:21.316
Dus ja, eigenlijk elk merk dat AI wil inzetten in klantinteractie of service of campagnes, uh, kan dit gaan toepassen.

117
00:17:21.356 --> 00:17:29.876
En het maakt AI niet alleen veiliger, maar ook vaak consistenter, omdat je beter traint op, o-op je merk, uh, en daarmee ook schaalbaarder. Yes. Kortom: niet afwachten, maar doen.

118
00:17:30.276 --> 00:17:43.576
Wil je weten hoe jij AI-interacties kunt opschalen zonder risico voor je merk? Kijk dan naar deptagency.com/aireport. Tot volgende week. [muziek] Je hoorde het net in de intro al even.

119
00:17:43.616 --> 00:17:52.056
Een zeskoppig bedrijf genaamd Poetic met een Q is als eerste door de 50% grens gebroken van de ARC-AGI2 Challenge.

120
00:17:52.096 --> 00:18:03.916
Dat is een test die binnen de AI-wereld geldt als de ultieme meetlat voor AGI, uh, algemene kunstmatige intelligentie. Dat is groot nieuwsLaten we eerst even opfrissen wat die ARC-test ook weer is.

121
00:18:03.936 --> 00:18:13.996
Dat is een test die is bedacht door ene François Chollet. Chollet. Chollet? Volgens mij. En dat is een AI-onderzoeker en die vindt dat we veel te makkelijk roepen dat AI intelligent is.

122
00:18:14.056 --> 00:18:18.716
En daarom ontwierp hij puzzels die meten waar AI slecht in is en waar mensen goed in zijn.

123
00:18:19.216 --> 00:18:30.195
Het zijn dus nieuwe, onbekende problemen die opgelost moeten worden door die AI, uh, zonder dat ze kunnen terugvallen op eerder geziene voorbeelden. Het zijn dus geheim, geheime testen voor een deel.

124
00:18:30.786 --> 00:18:37.356
Uh, vaak visuele puzzeltjes waarbij je moet ontdekken welke logica er achter een patroon zit. En die moet je dan vervolgens toepassen op een nieuwe situatie.

125
00:18:37.376 --> 00:18:43.976
Dat zijn, dat klinkt allemaal heel abstract, maar het zijn gewoon testjes die voor mensen te doen zijn, maar voor een computer heel lastig. Als je luistert en denkt: waar gaat dit over?

126
00:18:43.996 --> 00:18:51.796
Dan ka-- en je hebt bij de kerst, tijdens de kerst. Nou, dit is nou een leuk ding. Sommige mensen doen de AIVD-kerstpuzzel, maar er zijn ook mensen die doen de ARC-AGI2 Challenge.

127
00:18:52.036 --> 00:19:05.216
Misschien is dat iets wat wij kunnen doen onder de boom, Wytse. [lacht] Jij eerst. Ik hoor het wel van je. Vorig jaar werd de eerste versie, uh, van die test, de ARC-AGI1, verslagen door OpenAI's redeneermodel o1.

128
00:19:05.276 --> 00:19:17.876
Weet je nog? Uh, dat haalde ruim 75% in de zuinige modus en zelfs 85% met meer rekenkracht. Met extended thinking, zoals dat tegenwoordig heet. En experts riepen op een gegeven moment dat die test was gekraakt.

129
00:19:18.356 --> 00:19:29.616
Maar, s-, uh, Chollet zat al stilletjes te broeden op een nieuwe, veel moeilijkere versie. En dit voorjaar lanceerde hij dus de versie nummer 2. En de resultaten zetten de AI-wereld weer met beide benen op de grond.

130
00:19:29.676 --> 00:19:40.176
Want mensen scoren gemiddeld 60% op die test, maar een panel van, en een panel van experts, dus echt gewoon de echt slimme mensen, uh, haalt 100%. Dus gemiddelde mens 60% en echt, uh, slimme mensen 100%.

131
00:19:40.616 --> 00:19:55.296
OpenAI's beste model o3 op dat moment kwam niet verder dan 4% en het kostte $200 per taak om dat ding te laten broeden. En gewone taalmodellen op dat moment, zoals GPT 4,5 scoorden 0%.

132
00:19:55.416 --> 00:20:06.376
Nou, negen maanden lang bleef die kloon bestaan. Geen enkel model kwam ook maar in de buurt van die menselijke scores. En voordat we naar Poetic gaan, want die hebben dus weer een belangrijke slag geslagen.

133
00:20:06.616 --> 00:20:12.716
Waarom, Wytse, is deze test zo moeilijk voor AI? Nou, wat je eigenlijk, wat het idee, de,

134
00:20:13.636 --> 00:20:24.176
is van, v-van François Chollet, de, is dat taalmodellen, omdat het statistische modellen zijn, zijn ze echt goed in het gokken op iets wat ze al eerder hebben gezien.

135
00:20:24.636 --> 00:20:37.696
Maar wat onderdeel is van intelligentie, in ieder geval, dat is het hele debat, is: kan je ook dingen die je hebt geleerd op A toepassen op B? Ja. En dus kan jij, uh, een totaal nieuwe situatie ineens ook begrijpen.

136
00:20:37.796 --> 00:20:50.116
Of in ieder geval pogingen doen, leren van die pogingen en eigenlijk in het moment uitvinden door experimenteren wat bijvoorbeeld kinderen doen. Gewoon een beetje rommelen ermee, iets nieuws leren in het moment.

137
00:20:50.306 --> 00:20:59.116
Wat je eigenlijk doet, is: je hebt al een stukje bestaande kennis op een, uh, ander, binnen een ander domein bijvoorbeeld. Of je hebt een eerdere versie van een puzzel gezien die er een beetje op lijkt.

138
00:20:59.536 --> 00:21:02.616
Maar kan je dan ook de stap maken om te denken: maar wacht even,

139
00:21:03.576 --> 00:21:12.496
als ik hier een beetje mee ga rommelen, krijg ik het dan niet voor mekaar om al mijn eerder geleerde dingen plus de nieuwe deer-, dingen die ik leer tijdens het puzzelen toch die puzzel te kraken? M-hm.

140
00:21:12.616 --> 00:21:18.856
En wat tot nu toe de eerdere modellen, of ze nou multimodaal zijn, hè, dus dat ze mee kunnen kijken, visueel of alleen maar tekst voorspellen.

141
00:21:18.896 --> 00:21:28.196
Hè, soms werden de puzzels eerst omgezet in tekst, dan gegokt in tekst en dan weer terug. Of dus- Gingen beschrijven wat de puzzel was om hem dan op te lossen. Ja, want die kon niet kijken, zeg maar. Hij kon niet echt.

142
00:21:28.226 --> 00:21:36.136
Hij kon wel kijken om het te beschrijven, maar hij kon niet kijken om te denken. Kijken, precies. Ja, bizar. Inmiddels hebben we natuurlijk die omnimodellen of die multimodale modellen.

143
00:21:36.196 --> 00:21:46.536
Toen gingen die scores van ARC-AGI2 dus ook heel erg omhoog. Ja. Want je kon eigenlijk een soort bredere, tussen aanhalingstekens, intelligentie inzetten. Het was minder compressed ook. Ja, en je hoeft, precies.

144
00:21:46.576 --> 00:21:54.116
En het, niet alles. Kijk, die, t-, uh, puzzeltjes zijn zo ontworpen, eigenlijk expres. Ja. Het is, het is alsof jij, uhm,

145
00:21:55.076 --> 00:22:05.276
een student in je klas hebt zitten als docent die ontzettend goed antwoord geeft, waardoor he- waardoor heel de klas tegen hem of haar opkijkt, maar jij eigenlijk denkt: volgens mij weet je helemaal niks, man.

146
00:22:05.616 --> 00:22:15.686
Volgens mij zit jij gewoon heel slim net op tijd te bluffen en je bluft omdat je eigenlijk al alle vragen van mij al een keer hebt gezien, hè. Je bent vorig jaar al in mijn lessen geweest, hè. Dus. Ja. Ja.

147
00:22:15.696 --> 00:22:21.655
Maar als je dan, als je dat dan weet en je hebt die theorie, kan je natuurlijk vragen gaan verzinnen waardoor die student door de mand valt. Ja.

148
00:22:21.676 --> 00:22:29.456
En dit is wat de ARC-AGI Challenge is: hoe laat je een LLM door de mand vallen? En wetenschappelijk gezien is dat heel mooi, want volgens mij is wetenschap juist falsificeren.

149
00:22:29.496 --> 00:22:37.876
Dus je wilt constant eigenlijk zel- jezelf uitdagen om te zeggen: ik heb iets gebouwd, hè, want ze zijn allemaal best enthousiast bij ARC, uh, uh, over AI-modellen.

150
00:22:38.336 --> 00:22:48.496
Maar ook te zeggen: kunnen we niet puzzels maken waarop mensen heel goed zijn en AI's direct door de mand vallen? Ja. En dat gebeurde ook. Ja. Nou, en daar is nu dus Poetic.

151
00:22:49.016 --> 00:23:00.756
Uh, dat is een team van zes mensen, uh, die als eerste door die, uh, 50%-grens breekt van dit, uh, dit model wat dus eerder dit jaar is uitgekomen. Deze, deze test moet ik zeggen.

152
00:23:00.876 --> 00:23:11.456
Die test die eerder dit jaar is uitgekomen. Dus dat is de ARC-AGI2 Challenge, waarop dus o3h, hè, wat het summum was van reasoning, uh, nog zes maanden geleden. Ja. Uh, ja, niet- 4% scoorde.

153
00:23:11.676 --> 00:23:23.076
En ik bedoel, en Gemini, uh, 3 Pro zelf, hè, van Google. Het model van een maand geleden. Ja. Maakte ook al een leuke sprong op ARC-AGI2. Juist. Maar niet een spectaculaire sprong. Nee.

154
00:23:23.116 --> 00:23:35.756
En wat nu dus nieuws is, is dat er een clubje is die niet een eigen model hebben gemaakt. Toch door die grenzen zijn heen gebroken en ook nog best goedkoop, $30 per opgave aan dat dat ding dus moet denken.

155
00:23:35.796 --> 00:23:46.636
En wat je aan API-credits moet betalen aan, uh, aan Google in dit geval. Uh, dit zijn geen, uh, sukkels. Nee. Het zijn best wel slimme mensen, deze zes. Ex DeepMind, ex Google.

156
00:23:46.666 --> 00:23:58.128
[lacht] Hè, dus die hebben gewerkt met de mensen die Google DeepMind, sorry, Google Gemini ontwil- ontwikkeld hebben. Ik wil er wel meteen bij zeggen: je kan natuurlijk denkenEhm, want even in een aantal stappen.

157
00:23:58.188 --> 00:24:06.908
Het Poetic team heeft met z'n zessen een harnas of scaffold gemaakt, hè, een soort exoskeleton om Gemini heen, hè, dus- Ja, zij gebruiken Gemini 3 Pro.

158
00:24:07.288 --> 00:24:17.768
Ja, in het winnen van deze score, zeg maar, het behalen van deze score is een combinatie van de vanille Gemini 3 Pro, oftewel die jij kunt gebruiken in de Gemini app. Niets aan, niets aan aangepast. Ja.

159
00:24:18.288 --> 00:24:24.748
Maar je zou kunnen zeggen door heeeel slim te prompten. Ik ga straks uitleggen wat ik daarmee bedoel, want dat, doet het een beetje tekort.

160
00:24:25.148 --> 00:24:37.228
Maar te zeggen: geef ons nou maar gewoon wat iedereen krijgt in Gemini en wij gaan zo slim om met Gemini dat wij een veel hogere score kunnen halen dan Google zelf met hun eigen model lukt op Arc AGI 2. Ja.

161
00:24:37.668 --> 00:24:46.348
En dat is best wel bizar. Ja. En dat, dat heeft dus een aantal implicaties waardoor ik dacht: dit is, dit nieuws mag toch wel wat groter uitge-uitgemeten worden, dus we gaan nu ons best doen. Daar hebben we het over.

162
00:24:46.398 --> 00:24:47.608
Maar wat hebben zij gedaan?

163
00:24:48.148 --> 00:24:59.588
Wat ze eigenlijk hebben gedaan is in eerste instantie nog zonder dat Gemini 3 Pro uit was, en dit maakt het heel boeiend, want zij zeiden: als Poetic zijnde willen wij eigenlijk, uh, model scaffolds maken, hè.

164
00:24:59.688 --> 00:25:07.148
Dus, uh, scaffolding is net als dat je een steiger om een huis heen zet, hè. Dus je hebt het huis zelf, dat is het model en de steigers staat daar omheen als extra, zeg maar.

165
00:25:07.188 --> 00:25:13.658
Dus je bent om het model heen extra features aan het bouwen. Je hangt als het ware ballen in de kerstboom, hè, dus je doet er iets bij. Mhmm.

166
00:25:13.888 --> 00:25:21.388
Dat je zegt: voor alle modellen willen we een scaffold maken waardoor alle modellen sterker worden op hun eigen manier. Dus wat zijn ze gaan doen?

167
00:25:21.448 --> 00:25:33.768
Ze hebben JP-- GPT-120B, dus het open source model van Open, uh, van OpenAI, uh, Claude, uh, maar ook, uh, Gemini 2.5 destijds hebben ze een scaffold omheen gebouwd die werkt voor al die modellen.

168
00:25:33.888 --> 00:25:42.448
Ja, dus het is een soort superheldenpak dat iedereen aan kan trekken. Absoluut. En wat hebben ze-- wat doen ze dan? Nou, in dat superheldenpak zitten een aantal onderdelen.

169
00:25:42.568 --> 00:25:48.548
Uhm, wat heel belangrijk is, is dat wat we nu eigenlijk niet goed hebben is test time compute.

170
00:25:48.608 --> 00:25:58.168
Dus dat houdt in: je hebt training, pre-training compute, dus dat is alle computerkracht in datacenters die je inzet om de modellen te trainen om ze te bakken, hè. Dat is het bakproces van het model.

171
00:25:58.368 --> 00:26:06.487
Dat kost heel veel water, energie, noem het allemaal maar op. En, en data. En uiteindelijk komt daar dan Gemini 3 Pro uit. Daar gaat dit allemaal niet over. Absoluut niet.

172
00:26:06.758 --> 00:26:12.908
Dat hebben ze ook eigenlijk een beetje afgesproken om te zeggen: daar gaan wij niet aan zitten. Ja. Laat dat de grote labs maar doen.

173
00:26:13.488 --> 00:26:23.908
Want wij, wij krijgen eigenlijk het model als af, uh, aangeleverd en wij gaan het dan nog, hè, we gaan nog een camperdak bouwen op dat busje, zeg maar. Geef ons maar dat busje, wij gaan er nog effe mee door.

174
00:26:24.008 --> 00:26:36.268
En, uh, de test time compute is eigenlijk dat je zegt: op het moment dat je met het model aan het praten bent, hè, dan kun je ook nog computerkracht inzetten om het model wat al af is eigenlijk nog extra kracht te geven.

175
00:26:36.418 --> 00:26:45.588
Wacht, op een- Ja, dus even voor jouw beeld. Uhm, je hebt trainen en je hebt inference. Ja, dat snap ik. Ja, en de inference is dus test time compute.

176
00:26:45.608 --> 00:26:54.208
Dat is het moment dat het model wat eigenlijk statisch is op dat moment, je kan het niet meer aanpassen, dat je het model nog de mogelijkheid geeft om na te denken. Ja.

177
00:26:54.728 --> 00:26:59.608
En dat, dat denken, dat kost, uh, uiteindelijk computerkracht. Ja, dus dat knopje met external thinking.

178
00:26:59.648 --> 00:27:08.348
En testing is eigenlijk, is eigenlijk wanneer je, je kunt oefenen thuis voor de toets en je hebt het mondeling examen. Ja. Het mondeling examen is test time compute.

179
00:27:08.378 --> 00:27:14.048
Als in: hoe lang krijg jij van die docent om na te denken over je antwoord? Ja. Maar je mag niet meer je boeken erbij pakken.

180
00:27:14.188 --> 00:27:20.288
Ik bedoel, dat is nog een beetje, het is een beetje een maffe metafoor, maar ga er maar van uit: je bent al voorbereid. Je hebt je prep al gedaan.

181
00:27:20.328 --> 00:27:27.768
Je mag trouwens nog wel je boeken erbij pakken, maar dan moet je wel donders goed weten wa- naar welke pagina je toe moet bladeren, want je hebt maar vijf minuten. Ja. En

182
00:27:28.848 --> 00:27:40.108
het allerbelangrijkste is wat, om even terug te haken op, uh, die puzzeltjes, want daar gaat het uiteindelijk over. Nu is het zo geweest dat Gemini 3 Pro krijgt die puzzel te zien en die heeft dan eigenlijk twee shots.

183
00:27:40.148 --> 00:27:48.468
Dus je heeft twee pogingen om die puzzel te maken. Oké. En dan krijg je je cijfer. Dat is hoe dit, deze test werkt. Ja, dat was het. Je mag twee keer proberen. Oké. Uhm, maar,

184
00:27:49.748 --> 00:27:58.808
uh, dan eig-- en, en dan krijg je inderdaad het volgende puzzeltje. Mhmm. Maar wat je geleerd hebt bij het eerste puzzeltje is weg, want het is een nieuw gesprek voor het tweede puzzeltje. Oké.

185
00:27:58.868 --> 00:28:01.968
Dus een van de eerste dingen die zij zijn gaan doen is zeggen: oké, wacht even.

186
00:28:02.528 --> 00:28:12.528
Als jij puzzels maakt en je ontdekt daar terwijl je ze aan het maken bent nieuwe inzichten, dan ga je die inzichten opschrijven en krijg je daarmee, uhm- Juist.

187
00:28:12.648 --> 00:28:22.458
Ja, en er zijn ook nog eens, je bent niet in je eentje puzzels aan het oplossen, maar met heel veel Gemini's tegelijk. Die ook nog eens met elkaar hun inzichten delen. Ah. En ook nog eens, want ik ga nu effe stapelen.

188
00:28:22.508 --> 00:28:32.268
Ze hebben iets van 12 innovaties gedaan, uh, in die, in dat Superman-pak. In dat superheldenpak zitten 12 trucjes op zijn minst. Ik weet niet of ik ze alle 12 uit mijn hoofd zal zeggen, maar ik ga de belangrijkste langs.

189
00:28:32.768 --> 00:28:44.848
Dus, uhm, jij geeft de initiële prompt, van hun is al een goede prompt, hè. Daar zaten-- [stammelt] dus, dus, laat ik zeggen, als, als soort prompt engineers hebben ze al een goede prompt gemaakt om puzzels op te lossen.

190
00:28:44.928 --> 00:28:52.708
Dat is één. Dan zit er in die prompt ook, die prompt is vloeibaar, als in: als je een puzzel hebt gemaakt, dan heb je ervan geleerd wat je verkeerd hebt gedaan.

191
00:28:52.768 --> 00:29:04.208
Want we hebben jou ook dankzij die hele goede prompt, uh, een manier gegeven om beter te snappen wat je verkeerd hebt gedaan. Dus, uh, iedere test die faalt is informatie. Ja.

192
00:29:04.528 --> 00:29:08.628
Want het is niet alleen maar: kijk, het enige wat Arc AGI tegen jou zegt is: fout.

193
00:29:09.348 --> 00:29:27.508
Is dit niet wat een, zeg maar, als ik naar, als ik aan Google's, uh, Gemini iets vraag en ik kli-klap dan vervolgens die redeneerdrant open, dat je kan zien welke stappen die allemaal maakt bij het nadenken, dan zie ik hem regelmatig zichzelf op fouten betrappen en dan

194
00:29:28.448 --> 00:29:39.688
eigenlijk een nieuwe route inslaan. Dus leren van die fout. Ja. Wat je nu beschrijft klinkt alsof dit al gebeurt. Ja, het gebeurt alleen heel slecht. Oké. Dat blijkt, want de scores zijn veel lager op Arc AGI.

195
00:29:39.828 --> 00:29:46.958
Hij is niet goed in van zichzelf, lu- van zijn eigen fouten leren. En hij loopt heel vaak, uh, in cirkels en vast, zeg maar. Ja.

196
00:29:46.968 --> 00:29:51.648
Dus even voor de mensen die al langer deze, uh, podcast luisteren, dat zijn velen van jullie denk ik.

197
00:29:52.268 --> 00:30:02.408
We hebben het er al eens over gehad dat heel veel van de sprongen die nu door de modellen an sich gemaakt worden zijn omdat die, een deel van dat Superman-pak inmiddels toegevoegd is aan het model zelf, hè. Ja.

198
00:30:02.428 --> 00:30:13.564
Dat, dat, als het ware het pak zit vastgeplakt als huid aan het model. Een beetje een maffe metafoor, maar goed. Uhm.Wat ze bij Poetic zeiden is: oké, luister, we hebben een aantal innovaties gedaan.

199
00:30:13.784 --> 00:30:19.684
Daar kunnen alle labs van leren. Ja. En een deel daarvan kunnen ze ook in de modellen gaan stoppen. Ja. Maar wat zegt Poetic?

200
00:30:19.724 --> 00:30:25.814
Volgens mij moet hier een scheiding gaan ontstaan waarin wij een pak maken dat op alle modellen werkt. Juist.

201
00:30:25.844 --> 00:30:32.644
En ik denk als ik hier zelf naar kijk, sla ik even een paar stapjes over alvast richting een soort, uh, conclusie, maar dan hebben we die alvast staan.

202
00:30:33.864 --> 00:30:44.594
In, uh, engineering, hardware en software heb je zoiets als separation of concerns. Dat houdt in dat, uh, jij hebt, uh, op een, op jouw server staat een e-mailserver.

203
00:30:44.644 --> 00:30:54.244
Die kan e-mail ontvangen en die maakt een mailboxje aan. Ja. Er staat ook een DNS-server, die doet, uh, namen omzetten naar IP-adressen. Dat zijn twee verschillende services met twee verschillende rollen. Ja.

204
00:30:54.324 --> 00:30:57.744
Hun, de concerns zijn separated in die twee services.

205
00:30:58.284 --> 00:31:06.844
Wat we, wat we nu aan het ontdekken zijn met elkaar, LLM's zijn nog best wel jong, is: hoeveel moet er nou in die base model zitten en hoeveel moet er zitten in test time?

206
00:31:07.384 --> 00:31:17.224
En moet je die scaffold dan- Test time bedoel jij dus mee: het daadwerkelijk gebruiken van- Ja, want je-...het model. Ja, precies. Test time. En, uh, precies, dus, ja, dat woord test is een beetje stom misschien.

207
00:31:17.234 --> 00:31:25.604
Ja, heel raar woord. Misschien gewoon wanneer je het gebruikt. Juist. [lacht] Ja. Ja, dat is gewoon toch beter, toch? Ja, tijdens het mondeling, uh, wa-want dan heb je niet me-, kan je niet meer zoveel fixen, hè.

208
00:31:25.644 --> 00:31:35.104
Je bent erin, van, uh, tijdens de opname van AI Report. Ja. Dit is test time compute, Wietse, waar je nu mee praat. Helder, ik zal voortaan [Niels lacht] dit taalgebruik overnemen. Ja, en je wilt eigenlijk, uhm,

209
00:31:36.944 --> 00:31:45.724
wat blijkt is dat, je kunt proberen om alles in de training te doen, want dat scheelt natuurlijk een hoop test time compute, want die is best wel duur, hè. Mhm. En een eindgebruiker moet ook wachten. Mhm.

210
00:31:45.784 --> 00:31:56.564
Dus die, die labs zijn ook een beetje aan het duwen van: laat het alsjeblieft maar erin zitten. Maar wat blijkt? Die François Chollet, die is puzzels aan het maken waardoor dat, uh, wat er al in zit niet meer werkt.

211
00:31:57.144 --> 00:32:01.424
Juist, en dat is een kat-en-muisspel wat je de hele tijd kan proberen blijven inhalen.

212
00:32:01.464 --> 00:32:13.714
Maar misschien moet je dus iets veranderen aan, uhm, welke rol je het taalmodel geeft en welke rol je geeft aan de software waarin het taalmodel draait wat wij als gebruiker gewoon gebruiken.

213
00:32:13.724 --> 00:32:21.224
Ja, en dat een beetje die separation of concerns. Juist. Dat mogelijk is een betere architectuur voor AGI. Juist, oké, snap ik. Ja, want- En wat voor trucs doen ze dan?

214
00:32:21.384 --> 00:32:31.384
Nou, b-, je hebt bijvoorbeeld, uh, we hebben het vorige keer volgens mij ook wel eens gehad over vloeibare modellen. Dat zijn eigenlijk modellen die wel, uh, aangepast kunnen worden terwijl ze getest worden, hè.

215
00:32:31.424 --> 00:32:37.974
Dus heel veel mensen hebben de misvatting dat de AI die je vandaag de dag gebruikt, dat die soort van op jou aangepast wordt.

216
00:32:38.024 --> 00:32:43.964
Ja, er wordt wel een blokje memory gemaakt waarin die leert dat jij Alexander Klöpping ben, maar dat is alleen voor jou. Ja. Het staat alleen maar in jouw account.

217
00:32:43.974 --> 00:32:48.444
Het onderliggende model- Blijft hetzelfde...blijft, blijft misschien wel een jaar lang of nog langer hetzelfde.

218
00:32:48.464 --> 00:32:54.364
Precies, en daarom hebben ze ook versienummers, zodat je er ook een beetje op kan vertrouwen dat hij hetzelfde blijft. Ja. Dus dat is waarschijnlijk ook gewoon een goed idee. Ja.

219
00:32:54.744 --> 00:33:06.444
Maar waar je kunt zeggen: wacht even, is het niet handiger dat Gemini 3 Pro in dit geval al puzzelend leert, die leerlessen meteen onthoudt? Ja.

220
00:33:06.584 --> 00:33:15.724
Die gaan niet terug in de base model, maar die blijven ertussenin hangen in dat supermanpak, zeg maar. En eigenlijk al, al puzzelend steeds slimmer aan het worden is.

221
00:33:16.264 --> 00:33:23.264
Uh, en, en dat is dan nu eigenlijk de truc, hè, dat, dat wat ze dan, uh, recurring learning noemen, is dat ze- Recurring learning. Ja, dus dat je- Tijdens je test time compute.

222
00:33:23.304 --> 00:33:28.544
Ja, dus je hebt een loop, een cirkel waarin je draait. Ja, je doet een puzzel, je krijgt terug: fout.

223
00:33:29.084 --> 00:33:36.224
Maar je hebt ook gezorgd dat je prompt ervoor zorgt dat je niet alleen maar fout terugkrijgt, maar ook weet wat je fout gedaan hebt. Ja. Dan verzin je een nieuwe hypothese als model.

224
00:33:36.364 --> 00:33:43.624
Probeer het nog een keer, want je mag best wel vaak proberen. Sterker nog, je probeert het met 100 tegelijk en je gaat ook nog met elkaar communiceren over wat je geleerd hebt.

225
00:33:44.344 --> 00:33:51.224
Dan heb je ook nog een, uh, democratische stemronde, wat eigenlijk inhoudt- Democratische stemronde van modellen. Ja.

226
00:33:51.264 --> 00:34:00.844
Dus je, Gemini 3 Pro draait, zeg maar, multi-head, dus met meerdere hoofdjes tegelijk naast elkaar die lessen met elkaar delen. Meerdere kopieën van Gemini 3. Ja. Oké. Allemaal agents zou je ze kunnen noemen. Wauw. Oké.

227
00:34:01.164 --> 00:34:08.344
Die gaan daarna in, in conclaaf van: oké, luister, het is niemand gelukt om die puzzel op te lossen. Maar wat hebben we eigenlijk allemaal geleerd? Ze, ze, ze, ze, zo.

228
00:34:08.584 --> 00:34:13.984
Zullen we een nieuwe hypothese maken en het dan weer proberen? En dan op een gegeven moment brute force je als het ware die puzzel.

229
00:34:14.904 --> 00:34:23.164
Maar je hebt maar een maximaal aantal pogingen volgens ARC, dus je moet ook nog heel sni-slim inplannen. Ja. Eigenlijk in je eerste poging mooi gebruiken.

230
00:34:23.884 --> 00:34:33.784
Even, even een, uhm, [klikt tong] hoe zeg je dat, een, uh, uh, iets toe te geven op, in deze podcast. Ik zit nu toch niet meer op, uh, op school [lacht]. Ik deed dit een beetje op mijn eigen beetje suffe Wietze-manier.

231
00:34:34.544 --> 00:34:45.284
Mijn, mijn trucje was, mijn scaffold, hoe ik dat inrichtte was: ik ging naar de toets zonder te leren en ik deed altijd de herkansing, zodat ik alvast wist wat er gevraagd werd ongeveer.

232
00:34:45.984 --> 00:34:55.944
Dus het was, ik bedoel, de herkansing is nooit dezelfde toets, hè, laat dat duidelijk zijn. Als het goed is, soms wel. Nee, ik, ik, ik val stil omdat ik, uh- Dat ik de, de-...dit is een opzienbarend moment.

233
00:34:56.044 --> 00:35:03.274
Nou ja, het punt is dat ik- Jij ging zonder te leren naar de eerste toets. Ja, dan weet je alvast wat er gevraagd wordt ongeveer. Dan weet je al hoe dit ongeveer gaat. Ja, en dan doe je de herkansing.

234
00:35:03.274 --> 00:35:10.654
En dan ging je het uit je hoofd leren. Of dan dacht je een beetje: oh, ze, ze, ze pakken het wel aan. Nee, ik wilde vooral weten niet, uh, wat er gevraagd werd, maar hoe er gevraagd werd. Ja, ja, ja.

235
00:35:10.664 --> 00:35:21.364
Zo moet ik het zeggen. Zo. En je hebt dus op Arc AGI, om even de brug te maken waarom ik dit vertel, op Arc AGI heb je twee pogingen. Je bent een soort dieselgate, jij. Jij optimaliseerde je, je leren voor de test.

236
00:35:21.384 --> 00:35:34.144
Ja, nee, maar dit heb ik ook, ik heb ook heel vaak gezegd over- Onethisch van jou...in de basis, uh, een student die goed is, een student die goede, uh, cijfers haalt, zou in essentie, uh, kan je vooral van zeggen dat ze goed zijn in de toets maken.

237
00:35:34.184 --> 00:35:42.563
Ja, ja. Uh, dus, en bij mij deed, ik was heel vaak wel benieuwd van: oké, ik kan nu de hele, het hele boek uit mijn hoofd gaan leren, maar ik kan beter even kijken waarop ze gaan prikken. Ja.

238
00:35:42.604 --> 00:35:50.964
Nou, dat doet eigenlijk deze s-, deze, uh, poetic scaffold ook. Juist. Want die doet een eerste poging, een goede poging. Maakt het generaliseerbaarder.

239
00:35:51.224 --> 00:35:55.964
Ja, en dan leert hij van de eerste poging en daarmee doet hij de tweede poging. En niet alleen maar met meerdere tegelijk.

240
00:35:55.984 --> 00:36:08.024
Nou, ondertussen is de volgende test van, of de volgende versie van deze test is alweer in ontwikkeling en dat blijkt dus ook nodig te zijn met deze, uh, vooruitgang van deze zes, uh, ex-DeepMind-mensen.

241
00:36:08.764 --> 00:36:14.648
UhmDe volgende test zal waarschijnlijk gaan niet meer over statische puzzels, maar interactieve game omgevingen.

242
00:36:14.708 --> 00:36:22.468
AI-agents moeten daarin waarnemen, beslissen en handelen over meerdere stappen zonder voorafgaande instructies. De puzzel gaat veranderen terwijl je ermee bezig bent, hè.

243
00:36:22.888 --> 00:36:32.928
In plaats van dat die op, je zou de ARC juist jij kunnen uitprinten als het ware. Nu kan je hem nog uitprinten, maar straks wordt het een game waar je een puzzel in moet doen. Dat zijn interactive reasoning benchmarks.

244
00:36:33.128 --> 00:36:42.808
Jezus Christus. Uh, ze testen een breder scala aan vaardigheden exploratie, planning, geheugen en doelen begrijpen. Ik begin wel op het moment te komen dat ik denk: why would we care?

245
00:36:42.928 --> 00:36:58.228
Nou, oké, dat, dat is wel een hele belangrijke, omdat in het hele- Leuk die nerds met hun puzzels, maar. In het hele, uh, brede debat rondom AI en wat is dit nou eigenlijk? Zijn taalmodellen een vorm van intelligentie?

246
00:36:58.768 --> 00:37:13.218
Uh, en zo ja, kan dat dan doorschalen naar iets wat dan lijkt op wat wij doen? Op zo'n manier, ja, dat 95% van het kenniswerk, uh, vervangen kan worden door agents. En hoe helpt het doen van een spelletje daarbij?

247
00:37:13.948 --> 00:37:25.088
Nou, dat nu, uhm, de sceptici, en dat is allemaal, uh, de Gary Marcus' van deze wereld voor de mensen die dat interessant vinden om te lezen. Die claimen: leuke truc, die taalmodellen.

248
00:37:25.288 --> 00:37:31.568
Leuke truc, het voorspellen van pixels en video's en alles. Maar het heeft gewoon weinig te doen met wat wij als mensen kunnen.

249
00:37:32.008 --> 00:37:39.028
Nog even los van wat wij als mensen zijn, hè, dat is een hele filosofische discussie, maar vooral: dat schaalt niet naar een niveau.

250
00:37:39.348 --> 00:37:52.628
Je kunt niet zeggen: met wat trucjes en wat tweakjes en wat superhero pakken kunnen wij van een GPT, een, een, een, een tekstvoorspeller en een beetje beeld voorspellen, komen tot iets wat 95% van het kenniswerk gaat doen.

251
00:37:52.688 --> 00:38:04.368
Als dat even de definitie van AGI is. Om daar wel te komen, moeten we terug naar de drawing board. We moeten, uh, een hele nieuwe vormen van AI gaan uitvinden. Wat ik vorige week zei,

252
00:38:05.448 --> 00:38:14.268
uh, omdat ik die optie openhoud, is: wat op het moment dat je een soort, uh, ik had het toen over zo'n compound eye, hè, dus dat een insect heeft 1.000, een oog wat bestaat uit 1.000 stukjes.

253
00:38:14.648 --> 00:38:20.848
Zijn het niet straks 1.000 AI'tjes die met elkaar samenwerken in een soort team? En wordt dat team dan AGI?

254
00:38:21.308 --> 00:38:30.128
Nou, eigenlijk zou je kunnen zeggen dat wat Poetic doet, dat die groep mensen die bij DeepMind vandaan komt, die zegt- Een team van AGI's. Ja. Of van AI's bedoel ik.

255
00:38:30.168 --> 00:38:41.348
Ja, ja, die eigenlijk zegt: ja, uh, inderdaad, één bandmember, een soloartiest is niet genoeg. Maar als we die band slimmer maken en eigenlijk.

256
00:38:41.428 --> 00:38:53.548
Want- Ja, maar eigenlijk, als ik je goed begrijp, zegt Gary Marcus dus als een van de, uh, sceptici, zegt: menselijk kenniswerk is zo ingewikkeld. Een AI-model gaat dat nooit in zijn eentje kunnen.

257
00:38:53.568 --> 00:39:06.788
En dan zeg jij: z-z-zelfs als dat waar is, doet het er niet toe. Want een ensemble, zou het kunnen dat het er niet toe doet, want een ensemble van AI's scoort elke keer weer beter op tests.

258
00:39:06.908 --> 00:39:19.868
En dat zijn nu gewoon testjes, uhm, waar je nog misschien om kan lachen. Maar als het straks testjes zijn die wel heel erg lijken op wat wij doen als wij werk doen, dan is het niet zo grappig meer.

259
00:39:20.168 --> 00:39:24.968
Nou, ik denk dat belangrijk is, ja, precies wat jij zegt. Belangrijk is dat ensemble verhaal.

260
00:39:25.068 --> 00:39:35.568
Dus het combineren van verschillende AI in een soort knowledge of the crowd, hè, dus dat je zegt: de groep weet meer dan het individu, is één van de stapjes van Poetic. Ja. Ze hebben meer ideeën, die hebben ze ook.

261
00:39:35.728 --> 00:39:42.328
Ze hebben een deel open source gemaakt, zodat ze zeiden: voor andere partijen, ga hier eens naar kijken, want we denken dat we wat fundamentele dingen hebben uitgevonden.

262
00:39:42.608 --> 00:39:52.508
Een deel houden- Ze zijn ook VC funded, dus ze houden wat dingen geheim. Ja, en, we, even voor jouw punt: waarom is het, uhm, uh- Why would we care? Waarom gaan we het hier nog veel meer over hebben in de toekomst?

263
00:39:53.368 --> 00:40:06.288
Wat Poetic nu zegt, is: ten eerste, het Superman-pak wat we hebben gemaakt kan je om alle modellen heen doen. En dat is waar. Ze hebben niet alleen maar ARC-AGI 2 getest met, uh, Gemini 3 Pro.

264
00:40:06.348 --> 00:40:14.488
Die kwam er als best uit, hè, dus Gemini 3 Pro plus Superman-pak van Poetic heeft nu die hoogste score gehaald. Ze hebben ook alle scores gepubliceerd voor andere modellen.

265
00:40:14.548 --> 00:40:23.428
Die zijn ook allemaal hoger dan het model alleen. Exact hetzelfde pak. Niet een pakje voor Gemini. Dat is al supervet. Als in: dat is gaaf, want dat is generaliseerbaar.

266
00:40:23.528 --> 00:40:31.768
Het woord generaliseerbaar is waar we het de komende jaren over gaan hebben. Is het generaliseerbaar? Ten tweede hebben ze gezegd, uh, aankondiging op hun blog. Ik ben heel benieuwd.

267
00:40:32.178 --> 00:40:40.528
We hebben niet alleen maar ARC-AGI 2 geprobeerd met dit harnas. We zijn alle andere benchmarks ook aan het afgaan, dus verwacht de komende maanden enorme- Zoals wat dan?

268
00:40:40.548 --> 00:40:50.628
Nou ja, we hebben een hele lijst van, uh, de Humanity's Last Exam, bijvoorbeeld. De hele, hele belangrijke benchmark wordt dan Humanity's Last Exam genoemd, hè. Onze laatste examen. Heel dramatisch.

269
00:40:50.638 --> 00:40:59.348
Elke keer een nieuwe, maar oké. [lacht] Nee, maar ik bedoel, ook daar komt dan waarschijnlijk weer een versie 2 en een versie 3 van. Kijk, hier zit- Maar bijvoorbeeld ook voor programmeren. Absoluut. Juist.

270
00:40:59.368 --> 00:41:11.628
En dan wordt het wezenlijk. Ja, want wat, wat ik nu zelf. Kijk, ik zie Poetic, ik zie het wel als een soort Poetic moment dat ik denk: oké, wauw, wat zij nu bewezen hebben, mogelijk, zeer mogelijk,

271
00:41:12.968 --> 00:41:23.528
is dat er nog ontzettend veel te halen is- Ja...zonder dat je de base, base models hoeft aan te passen. Zonder die, al die GPU cycles bij het trainen van het basismodel. Je kan de GPU cycles gebruiken bij het testen, hè.

272
00:41:23.608 --> 00:41:36.348
Ik bedoel op een andere plek, maar dan nog. Juist. En het laat mij zien dat, kijk, uiteindelijk, uh, jouw smartphone, jouw computer, jouw tablet. Die apparaten zijn ook een hele lage constructie.

273
00:41:36.388 --> 00:41:47.408
Daarmee bedoel ik: er zit een computer CPU in, die kan eigenlijk alleen maar enen en nullen optellen en, uh, vermenigvuldigen. Dat is gewoon een basis, uh, uh, math processor plus nog wat dingen eromheen.

274
00:41:48.028 --> 00:41:57.248
Daaroverheen is allemaal software gebouwd op dat basisprincipe van, eigenlijk zeg je eigenlijk tegen die processor: luister, als jij gewoon heel goed bent in data manipuleren.

275
00:41:57.308 --> 00:42:05.140
Je hoeft niet te weten wat het is, maar als jij gewoon heel goed bent in data manipulatieDan gaan we daar abstractielagen overheen bouwen waardoor er uiteindelijk een computergame op gaat draaien.

276
00:42:05.200 --> 00:42:12.360
Op CPU-niveau heb je er helemaal geen zicht op. Het is alleen maar het heen en weer gaan van nullen en enen, maar uiteindelijk is de eindgebruiker een computerspel aan het spelen.

277
00:42:12.480 --> 00:42:22.560
Mijn punt is dat de modellen zoals Gemini waarschijnlijk de rol zullen gaan vervullen van een fundamentele schakel in zo'n AGI-ensemble-achtige scaffold.

278
00:42:22.800 --> 00:42:27.820
Dus er gaan lagen over, uh, de GPT's en de Gemini's van deze wereld heen gebouwd worden.

279
00:42:28.260 --> 00:42:37.740
Niet door de Googles van deze wereld, maar door andere partijen die eigenlijk als, als brein een deel van het brein, uh, die modellen gebruiken.

280
00:42:37.760 --> 00:42:51.420
Maar de rest komt door alle laagjes eroverheen en dat is een andere architectuur en daardoor wat mij betreft de discussie: LLM's of Gemini's kunnen niet AGI worden.

281
00:42:51.820 --> 00:43:01.260
Dan zou ik zeggen: oké, fair, dan kan je terug naar de tekentafel of zeggen: ze worden onderdeel van een samenwerking tussen allerlei laagjes.

282
00:43:01.660 --> 00:43:14.100
Ondertussen komen er nog steeds basismodellen uit, zoals dus 5.2 van, uuuh, ja, ChatGPT zou je kunnen zeggen. Wat, uuuh, ik zei in het begin: jij bent hier kritisch over. Waarom ben je hier eigenlijk kritisch over?

283
00:43:14.260 --> 00:43:25.380
Nou, ik vind in, in, uhm. Dit gaat waarschijnlijk gebeuren deze week of is al gebeurd als je nu luistert. De, uh, OpenAI speelt een beetje paniekvoetbal op dit moment. Zo voelt het voor mij.

284
00:43:25.940 --> 00:43:35.370
Uh, dus je hebt, als jij een roadmap, roadmap hebt waarop je bepaalt wat je het komende jaar gaat doen of het komende half jaar, en je past die roadmap aan aan de hand van wat je concurrenten doen.

285
00:43:35.370 --> 00:43:47.260
Binnen een paar weken, hè, laten we wel wezen. Ja, nou ja, goed, de, uhm, ik ben kritisch omdat ik, ja, dit is, ik zit nog in het vorige verhaal en dat sluit hier ook op aan. Wij,

286
00:43:48.280 --> 00:43:56.900
het is een beetje een ingewikkeld ding aan het worden omdat wat GPT-5 was ook al een deel Superman-pak is. Het is ook al een model plus dingen eromheen. Ja.

287
00:43:57.100 --> 00:44:02.920
En dan kunnen wij zeggen: hoeveel van dat pak zit inmiddels in het model versus, weet je, het doet er uiteindelijk even niet toe. Het komt erop neer

288
00:44:04.640 --> 00:44:18.970
dat er, uh, het steeds moeilijker aan het worden is om een soort van eenvoudig, zonder allerlei, uh, uh, metaforen en moeilijke lagen modellen van, uh, [gniffelt] processors en zo erbij te halen, te praten over: wie heeft nou de beste AI?

289
00:44:19.040 --> 00:44:20.660
Mhmm. Die vraag is legitiem.

290
00:44:21.060 --> 00:44:31.440
Die kan je ook stellen, maar dan vraag je eigenlijk: wie heeft de beste modellen plus model scaffolding in de beste UI, waardoor een eindgebruiker denkt: ik wil Gemini gebruiken in de App Store. Ja, ja.

291
00:44:31.480 --> 00:44:40.060
En dat doet ei-, die eindgebruiker er ook niet toe. Die heeft gewoon vragen. Ja. En die heeft gewoon puzzels, met een hoofdletter P, en die moeten opgelost worden. Puzzels in PowerPoint. Ja, klaar. En Excel.

292
00:44:40.440 --> 00:44:53.600
En ik, ik denk wel dat, uhm, wat, om toch nog even op GPT-5.2 te komen. Waar OpenAI nu mee zit is dat ze eigenlijk in die scaffold rom, om die modellen heen allerlei trucjes aan het doen zijn, hè.

293
00:44:53.680 --> 00:44:59.769
Kiezen voor denken of niet denken. Uh, uh, de tone of voice heel erg aan het aanpassen zijn. Kies maar je eigen tone of voice.

294
00:44:59.829 --> 00:45:07.620
Het voelt allemaal best wel-- ik kreeg vanochtend een pop-up in ChatGPT die zei: hoe wil je eigenlijk dat we tegen je praten? Dat ik dacht: ja, ik heb dat bij Gemini nooit hoeven zeggen en dat gaat prima.

295
00:45:08.480 --> 00:45:15.260
Uh, als in, ik vo-- het voelde voor mij dat ik een beetje dacht: hebben jullie het nog een beetje onder controle of, of, of ben je een beetje he-heen en weer aan het springen? Ja.

296
00:45:15.280 --> 00:45:24.760
En dit is niet helemaal mijn mening, want ik, ik heb ook veel- Dit zijn de vibes. Ik lees ook veel van mensen die zeggen: het voelt alsof, uh,

297
00:45:25.960 --> 00:45:34.620
binnen OpenAI, en dit kan met een maand anders zijn als, uh, als een a-, als een ander team wat scherper zet, hoor. Dus, uh, wie weet, uh, verandert de koers nog, maar

298
00:45:35.780 --> 00:45:43.420
heel snel hebben gebouwd, iedereen voor wilden blijven, daardoor alle trucjes uit de kast hebben gepakt om er maar overheen te bouwen, om er overheen te bouwen.

299
00:45:44.040 --> 00:45:47.080
Uh, dan maar vlug weer de systeemprompt aanpassen, want dit ging mis.

300
00:45:47.140 --> 00:45:55.920
Dan maar een router ervoor, want denken gaat mis, maar uiteindelijk zijn dat niet een soort diepe arsje, ars-- dat is niet een, een, een, een soort duurzame, uh, uh, strategie.

301
00:45:55.930 --> 00:46:08.860
Ja, waar we, waar Gemini vanaf de grond opnieuw is opgebouwd. Zie jij in OpenAI's perspectief vooral een, een soort van, uh, met ducttape aan elkaar getapete onderdelen. Ja, ik zit al een tijdje in software.

302
00:46:08.940 --> 00:46:20.780
Ja, daar word je niet boos van. Nou. Wat kunnen ze nu doen om jou positief te verbazen bij 5.2? Uhm. Niet zoveel, zou ik toch zeggen. Nou, ik bedoel, kijk, als, als de 5.2,

303
00:46:21.700 --> 00:46:28.840
uh, soort de rommel opruimen release is, hè, dus we zijn een beetje te hard gegaan bij 5 en 5. 5.1 was ook al een beetje een rommel opruimen. Ja.

304
00:46:29.380 --> 00:46:39.800
Van: we beginnen beter door te krijgen wat we eigenlijk hebben gemaakt met 5 nu die in de wereld is en mensen er ook kritisch over zijn. 5.2 lost een lijst van 20 problemen op.

305
00:46:40.180 --> 00:46:49.660
Het gaat mij uitein- dan niet zozeer om benchmarks. Mhmm. Maar vooral om, merk ik zelf dat ik weer terug ga grijpen naar ChatGPT. Dat is wel mijn eigen benchmark.

306
00:46:49.740 --> 00:46:58.760
Ik wissel een beetje tussen die modellen aan de hand van wat ze voor me kunnen doen. Mhmm. Wat, hoe ze mijn problemen kunnen oplossen of, uh, dromen kunnen waarmaken, zeg maar. Ja. En ik merk dat ik me

307
00:46:59.720 --> 00:47:11.560
als eindgebruiker begin te voelen met mijn technische achtergrond dat ik bij OpenAI zoiets heb: ik mis focus en die focus die mist in het diepst van het bedrijf voel ik in het eindproduct.

308
00:47:11.600 --> 00:47:13.860
Namelijk: jullie zijn pleisters aan het plakken overal op.

309
00:47:13.900 --> 00:47:27.140
En het kan prima zo zijn dat er nu een team GPT-5.5 of 6 naast loopt waartegen gezegd is: ik geef jullie even een paar maanden de tijd, ruim het op en breng alsjeblieft iets uit wat niet doorbouwt op de rommel die we hiervoor hebben gemaakt.

310
00:47:27.150 --> 00:47:33.260
Hè, zo werkt het vaak een beetje binnen softwarebedrijven. Vlug even een team ernaast en dan, uh, het oplossen. Uh, maar

311
00:47:34.360 --> 00:47:47.460
ik vind gewoon de, uh, die 5.2 en de beetje de, de media daaromheen voelt heel erg als een vrij, uh, rommelige, uh, paniekvoetballer, reactieve, uh, actie, zeg maar. Oké.

312
00:47:48.400 --> 00:47:57.460
Maar ik wou, ik, ik wil nog wel even terugkomen op, uh, wat er bij, wat er bij Poetic gebeurt. Want je hebt het over welke trucjes zitten er allemaal in? Uh, misschien toch nog even goed

313
00:47:58.840 --> 00:48:12.120
om, om te benadrukken dat dit precies, uh, de kritiek die, uh, Colin heeft op, uhmAlle eerdere modellen is dat ze niet kunnen leren terwijl ze aan het puzzelen zijn.

314
00:48:12.640 --> 00:48:21.080
En wat Poetic gebouwd heeft, is precies wat Cole zegt dat er in moet zitten. Kan je leren terwijl je antwoord aan het geven bent.

315
00:48:21.560 --> 00:48:29.360
En ik denk dat we misschien gedacht hadden dat dat in de basis modellen gezet moest worden, maar dat kan blijkbaar prima in het Superman pak gestopt worden.

316
00:48:29.400 --> 00:48:39.780
Ja, ja, wat zomaar eens een fundamentele stap zou kunnen zijn in hoe we over een jaar over AI praten. Dat het zelflerend wordt. Nou ja, precies. En in dat opzicht zou je kunnen zeggen. Erop.

317
00:48:40.380 --> 00:48:46.160
Ja, ja, als precies in een andere laag dat we moeten naar een andere laag gaan kijken. En je zou kunnen zeggen.

318
00:48:46.740 --> 00:48:57.120
Ik ben dus heel benieuwd of we de komende maanden allerlei benchmarks gaan krijgen waar ineens weer tien of vijftien procent op het grafiekje erbij komt, puur en alleen maar doordat ze dat Superman pak hebben aangetrokken.

319
00:48:58.520 --> 00:49:07.620
Ja, je kan af en toe het idee krijgen soort van hoe snel gaat het nou eigenlijk allemaal? Maar dit is echt een prima manier om te kijken hoe fucking snel het gaat, de snelheid waarmee ze nieuwe tests moeten maken.

320
00:49:07.720 --> 00:49:17.840
Goed Wietse, we komen weer terug naar aarde, want iedere week testen we een tool die je kan gebruiken in je leven of in je werk. En deze week is dat Tasklet.

321
00:49:18.120 --> 00:49:23.420
Beeld je eens in, je komt 's ochtends op kantoor en je inbox bevat al een overzicht van het belangrijkste nieuws uit jouw vakgebied.

322
00:49:23.980 --> 00:49:34.220
Je agenda afspraken zijn automatisch voorzien van achtergrondinformatie over de mensen die je spreekt. En die wekelijkse statusupdate die je normaal naar je team stuurt, die is al verstuurd zonder dat je het vroeg.

323
00:49:34.340 --> 00:49:42.200
Deze week testen we Tasklet. Dat is een platform waarmee je dit soort AI agents maakt in gewone mensentaal. Je hoeft niet te programmeren of met blokjes te slepen.

324
00:49:42.240 --> 00:49:48.520
Je bouwt gewoon, of je beschrijft eigenlijk gewoon in het Nederlands wat je wil. En dan probeert die AI de rest te regelen.

325
00:49:48.740 --> 00:49:58.340
Het belangrijkste wat dat ding doet, is verbindingen maken met die MCP's waar we het eerder over hadden. Dus hij kan op. Met groot gemak kan hij allerlei tooltjes aan elkaar koppelen.

326
00:49:58.720 --> 00:50:02.460
Je hoeft niets meer te vragen dan maak inderdaad die.

327
00:50:03.620 --> 00:50:10.620
Maak een overzicht van het belangrijkste nieuws in mijn vakgebied en dan begrijpt dat ding dat hij jou moet mailen en dat hij daarvoor een Gmail connectie moet hebben. Ik noem maar een voorbeeld.

328
00:50:11.000 --> 00:50:17.560
En dan is dus één keer vragen verbind met Gmail genoeg om die koppeling te maken. Dat is verder helemaal geen technisch werk wat je daarvoor hoeft te doen.

329
00:50:18.300 --> 00:50:27.700
Onze redacteur Zhang test het met die dagelijkse AI nieuws briefing. Dus een briefing over jouw vakgebied, in ons geval AI. En binnen 2 minuten stond alles. Is niet gewoon concurrentie voor onze eigen nieuwsbrief.

330
00:50:27.800 --> 00:50:36.700
Iets heel heftig schema e-mailadres, bronnen en de volgende dag laat er een keurig gestructureerd overzicht in haar inbox, opgedeeld in categorieën als doorbraken, investeringen en beleid.

331
00:50:37.200 --> 00:50:45.100
Het mooie is je kan dit instellen door gewoon te chatten met die agent om dingen aan te passen. Dus die eerste briefing die zij kreeg bevatte bijvoorbeeld geen linkjes.

332
00:50:45.170 --> 00:50:58.500
Zhang wilde dat wel en alle volgende e-mails werden vervolgens automatisch werkende links gestuurd. De kanttekening is dat Task niet goedkoop is en gratis gebruik beperkt is. Je loopt best wel snel tegen grenzen aan.

333
00:50:58.880 --> 00:51:01.800
Betaalde abonnementen beginnen bij $ 35 per maand, dus het is niet goedkoop.

334
00:51:01.840 --> 00:51:09.680
Maar als je dagelijks handmatig informatie bij elkaar sprokkelen of onderzoek doet dat eigenlijk best voorspelbaar is qua stappen, dan verdient het zich misschien wel terug.

335
00:51:10.020 --> 00:51:24.720
Als je wil weten hoe je alles uit die tool haalt, dan kun je onze nieuwsbrief checken via AI Report punt NL. Ik las nog een grappig ding Wietse, namelijk dat AI datacenters steeds meer industriële capaciteit opslokken.

336
00:51:25.010 --> 00:51:37.840
Dat zien we al een tijdje bij Bitcoin miners. Dat is inmiddels een matig bedrijfsmodel geworden om geld te verdienen met bitcoin koers. Je kijkt maar naar de aandelenkoersen van die bitcoin mining bedrijven.

337
00:51:37.900 --> 00:51:46.900
Maar zij hebben één ding wat al die AI bedrijven graag willen en dat is betrouwbare stroomaansluiting. Want voor bitcoin mining moet je heel veel stroom uitgeven. En datzelfde geldt voor AI bedrijven.

338
00:51:47.560 --> 00:51:55.100
En op dit moment is die stroom zo schaars dat AI bedrijven gretig bitcoin miners aan het opkopen zijn.

339
00:51:55.760 --> 00:52:09.280
En dat zegt iets over hoe de economie nu werkt, namelijk dat er heel veel onderdelen van de industrie in de brede zin van het woord eigenlijk hun werk nu aanpassen om meer energie voor AI bedrijven te leveren.

340
00:52:09.320 --> 00:52:25.140
En dat gaat best ver, want zelfs Boom, dat is een bedrijf wat een supersonisch passagiersvliegtuig wil maken. Eigenlijk een beetje de opvolger van de Concorde, gaat gasturbines van 42 megawatt verkopen aan datacentra.

341
00:52:25.219 --> 00:52:36.960
Dus die parkeren hun werk in het maken van supersonische vliegtuigen omdat zij ontdekten dat hun straalmotoren, waarmee zij dus die vliegtuigen laten vliegen, ook stroom kunnen opwekken.

342
00:52:37.020 --> 00:52:48.840
Het vliegtuig project gaat weliswaar door, maar dit gaat dan volgens het verhaal cruciale cashflow leveren om sneller supersonische vliegtuigen te maken. Het zijn letterlijk jet engines, dus in containers. Insane.

343
00:52:49.240 --> 00:52:56.320
Die dan naast de datacenters geplaatst worden waar kerosine ingaat. Aan één kant dan heel veel herrie en dan klappen daar allemaal kilowatt uit aan de andere kant.

344
00:52:56.920 --> 00:53:05.880
Ik denk dat de mensen die debatteren rondom vliegschaamte en AI-schaamte nu makkelijker uit kunnen leggen hoe vliegschaamte gekoppeld is aan AI-schaamte.

345
00:53:06.240 --> 00:53:15.600
Op het moment dat letterlijk de motoren uit vliegtuigen op de grond liggen naast datacenters. Daar liggen te blazen om elektriciteit op te wekken. Dit is dus niet een metafoor.

346
00:53:15.980 --> 00:53:21.940
Dit is letterlijk wat Boom met hun Boom Super. Maar jij zegt dit met enig cynisme, als ik goed, als ik het goed begrijp.

347
00:53:23.080 --> 00:53:31.380
Ja, vliegtuigmotoren op de grond gaan leggen naast datacenters waar je kerosine in doet en dan blazen en allemaal CO2 uit, word ik er natuurlijk niet vrolijk van. Ja, liever dit dan kolencentrales, toch?

348
00:53:32.200 --> 00:53:43.060
Ja, ik ken daar de berekeningen niet van. Ik zou zeggen zet het. Het lijkt me iets beter voor het milieu. Zet het allemaal bij Stuwmeer zou ik zeggen. Ja, gaat me te hard genoeg, hè? Ja, goed. Waarom zo snel?

349
00:53:43.560 --> 00:53:54.220
Economen noemen dit proces crowding out. Wanneer één sector zoveel kapitaal opslokt dat andere projecten in de snel in de knel komen. En dat is hier dus aan het gebeuren. Even door de economische bril bekeken.

350
00:53:54.700 --> 00:54:06.420
Elektriciteit, arbeid en dus industriële capaciteit. In dit geval dus van het maken van vliegtuigen naar stroom. Gasturbines maken voor datacentra. Alles stroomt richting AI.

351
00:54:07.120 --> 00:54:16.368
Het is het.Soms zou ik willen dat ik soort van even een jaartje of twee jaar vooruitkijken. Dat ik, dat ik zo vijf seconden in de toekomst kan zijn, maar één vraag kan stellen, namelijk: is de bubbel al gebarsten?

352
00:54:16.648 --> 00:54:23.468
Dat ik dan alleen maar ja of nee kan horen. Dat ik weet waar ik aan toe ben. Nou ja, en ik zou dan nog, uh, om even de cynische pet op te zetten: hebben we er al wat aan?

353
00:54:23.528 --> 00:54:33.047
Want ik bedoel, op heel veel punten in mijn leven voegt het best wel toe, hè, de verschillende AI, AI-tooling. Maar ik kan me, s-, uh, samenlevingsbreed wel voorstellen.

354
00:54:33.328 --> 00:54:35.248
Kijk, het is- Mensen denken: dat duurt wel lang allemaal.

355
00:54:35.288 --> 00:54:51.648
Nou ja, en ik, ik moet zeggen dat die, uh, kijk, als jij, als er letterlijk een, uh, een, een jet engine, uh, 200 meter van jouw achtertuin ligt te blazen omdat daar een datacenter is waarin blijkbaar, uh, Sora 2.0 videoslop gemaakt moet worden.

356
00:54:51.688 --> 00:54:58.458
Ik maak hem even heel concreet nu, hè. [lacht] Dus jij zit in je achtertuin. Ja. Je kinderen zijn verslaafd geraakt aan synthetische content. Die zitten te TikTokken de hele dag.

357
00:54:58.488 --> 00:55:04.848
Waar je op de achtergrond een herrie hoort en dan vraagt: wat is dat? Wat is dat? Dat is om die filmpjes te maken. Dat is een gasturbine [lacht] met een straalmotor erin.

358
00:55:04.908 --> 00:55:17.488
Om de filmpjes te maken op de telefoon van je kinderen. Ja, oké, ik zeg: maak even de cirkel rond. Mhmm. Uhm, d-, als dat het, als dat het enige AI-verhaal is, dan, dan, dan vind ik de podcast maken wel moeilijker.

359
00:55:17.928 --> 00:55:22.328
Ja, dat is niet het enige AI-verhaal. Nee. Dan kan je zeggen: ja, Wytse, dat hou jij jezelf voor.

360
00:55:22.588 --> 00:55:34.168
Nee, dat is niet het enige A-AI-verhaal, maar de verhouding moet wel een beetje blijven kloppen tussen jet engine slop [lacht] versus, uh, doorbraak op medisch veld en, uh, nou, noem het allemaal maar op. Ja.

361
00:55:35.508 --> 00:55:44.528
Doe mij maar doorbraken medisch bij Stuwmeer en niet jet engines voor Sora 2.0 AI TikTok-slop. Oké, nou, punt gemaakt.

362
00:55:44.828 --> 00:55:53.508
Uh, deze week, uh, ten slotte maakte ik een grappig dingetje mee met een research tool van Anthropic die een week online heeft gestaan en nu alweer offline is. Oh, waarom?

363
00:55:53.908 --> 00:56:01.028
Ik zeg het maar, ik zeg het er maar gelijk bij voordat je het wil proberen. Weet je waarom die offline is? Het was een test. Mhmm. Waarschijnlijk gaan ze hem wel online zetten, maar het was een test.

364
00:56:01.288 --> 00:56:12.488
Wat Anthropic de hele tijd doet, is allemaal onderzoek de wereld in brengen. Zij zijn best wel scheutig met het delen van, ook wel gevoelige, uh, resultaten van hun testen.

365
00:56:12.648 --> 00:56:16.508
Testen die over veiligheid gaan, maar ook over impact op onze economie.

366
00:56:17.508 --> 00:56:26.588
En zij wilden, naast dat ze natuurlijk allerlei onderzoek kunnen doen uit het gebruik van hun AI-tooling om de impact te meten op verschillende sectoren.

367
00:56:26.648 --> 00:56:35.848
Zij kunnen plat gezegd gewoon zien hoeveel wordt Claude met Excel gebruikt. Nou, dan kunnen we daar wat meer op gaan optimaliseren, willen ze ook kwalitatief onderzoek doen.

368
00:56:35.948 --> 00:56:46.328
Namelijk mensen vragen naar hun gevoelens bij hoe zij AI gebruiken en hoe ze Claude gebruiken en hoe AI past in hun leven. Wat ze positief eraan vinden, wat ze negatief eraan vinden.

369
00:56:47.228 --> 00:56:52.948
En zo'n, uh, onderzoeksproject op schaal doen is natuurlijk, uh, ja, arbeidsintensief.

370
00:56:53.008 --> 00:57:01.328
Je moet mensen gaan bellen en dan moet je ze vragen om iets, uh, te vertellen en dan schrijf je dat allemaal op en dan moet je dat weer gaan analyseren. En nou ja, je, je weet dat het veel tijd kost.

371
00:57:01.717 --> 00:57:15.608
Anthropic heeft dat geprobeerd voor zichzelf makkelijker te maken door een tool te maken, een chatbot te maken waarmee je dat gesprek kan voeren. Dus een chatbot die jou vraagt: wat vind je van de rol van AI in je werk?

372
00:57:16.868 --> 00:57:22.028
Waar ze snel achter kwamen, is dat als je dat met de standaard chatbot doet, dat mensen niet echt graag antwoord geven op die vragen.

373
00:57:22.408 --> 00:57:30.248
Want het is gewoon best wel saai om met een chatbot te vragen, te praten die alleen maar vragen stelt. En, uh, ja, het is gewoon niet motiverend voor mensen.

374
00:57:30.268 --> 00:57:35.328
Ze kwamen erachter: dit gebruiken mensen in de praktijk niet en dan kunnen we ons doel niet bereiken, want dan kunnen we niet genoeg onderzoek doen.

375
00:57:35.908 --> 00:57:46.888
Dus toen dachten ze: wat maakt nou dat mensen graag praten met, uh, iemand anders over dit soort, ja, abstracte en emotionele ideeën bij hun werk?

376
00:57:47.578 --> 00:58:06.028
Nou, een plek bijvoorbeeld waar dat goed werkt, is als jij naar een conferentie toe gaat en je vindt iemand uit jouw vakgebied die je niet kent, maar die wel uit jouw vakgebied is en die ongeleer-, ongeveer hetzelfde, uh, kennisniveau heeft als jij, mmm, waarmee je op hoog niveau kan praten over je werk.

377
00:58:06.388 --> 00:58:16.358
Dan zijn mensen een stuk meer geneigd om te gaan babbelen. En dit is geprobeer-, dit is wat ze geprobeerd hebben te emuleren in een researchproject. Een inhoudelijk gesprek. Een inhoudelijk gesprek.

378
00:58:16.388 --> 00:58:26.048
Op het niveau van, op jouw niveau. Op jouw niveau. Je wordt ontmoet op jouw niveau. Je wordt ontmoet op jouw niveau door een chatbot. Wat een heel ander type gesprek is dan hoe een chatbot normaal tegen je praat.

379
00:58:26.108 --> 00:58:36.608
Namelijk: je stelt een vraag en je krijgt een antwoord. Dit ding is er niet op uit om, uh, een soort van resolution te bieden. Dit ding is erop uit om het gesprek gaande te houden. En wat was dit voor je?

380
00:58:36.618 --> 00:58:44.828
Ik bedoel, ik heb het nooit gezien. Hoe zag dit er in die week uit dan? Wel een chatinterface. Ja, het ziet er gewoon uit als Claude op het web, maar dan net een beetje anders.

381
00:58:44.948 --> 00:58:53.688
En dat ding praat tegen jou in plaats van dat jij dat ding activeert. Die opent het gesprek. Ja, de rollen zijn omgedraaid en dat ding stelt dus een aantal vragen.

382
00:58:54.088 --> 00:59:03.248
En ik was hier, uh, ja, ik dacht van tev-, ik dacht van tevoren: oké, het staat een week online, dus ik ga het wel proberen, maar ik verwacht er niet al te veel van.

383
00:59:03.288 --> 00:59:09.748
Maar ik viel dus best wel in verbazing over dat ik best wel een leuke avond heb gehad [lacht] met dit ding.

384
00:59:09.978 --> 00:59:14.748
Maar, ka-, help me even, want ik, ik heb hier dus niks van gezien, dus ik ga het allemaal even aan jou moeten vragen.

385
00:59:14.828 --> 00:59:23.528
Je opent dit en je opent met een vraag en die gaat proberen zo snel mogelijk jou te ontmoeten, want die weet nog niet wie je bent. Toch? Ja, hij zegt gewoon: hoe gebruik jij AI in je werk?

386
00:59:24.428 --> 00:59:31.308
Of, de eerste vraag was volgens mij: wat is de laatste keer dat je AI in je werk hebt gebruikt? Dus ik een beetje babbelen.

387
00:59:32.348 --> 00:59:42.728
Dan vraagt hij dus, nou, dus hij zei al: nou, dit ga ik gebruik-, ik, soort van, je antwoord ga ik gebruiken om, uh, om te leren. En, uh, hoe meer details je me geeft, hoe beter.

388
00:59:42.768 --> 00:59:50.968
Ik, als je computer zo'n spraakfunctie heeft, dan zou ik die zeker nu even gebruiken. Zoiets stond er ook bij. Het was best grappig. Het was zoals een mens inderdaad. Heb je dat gedaan ook? Spraak, of?

389
00:59:51.028 --> 00:59:57.808
Nee, ik heb het allemaal getypt, want er waren meer mensen in de kamer. En- [lacht] Je zat met elkaar een kerstfilm te kijken. Het was toch ongemakkelijk. Ik ga hier verder niet op in.

390
00:59:58.048 --> 01:00:06.888
In ieder geval, ik zat leuk te kletsen met mijn chatbotvriend en dat ding vroeg dus: wanneer heb je voor het laatst AI gebruikt? Nou, ik daar een beetje antwoord op geven en toen begon hij wat meer details uit te vragen.

391
01:00:07.368 --> 01:00:11.928
Maar het was de manier waarop hij de details uitvroeg dat ik bleef praten.

392
01:00:11.948 --> 01:00:21.704
En hoe meer ik bleef praten, hoe leuker dat gesprek werd.En ik merkte dus dat ik best wel serieuze antwoorden aan het geven was, omdat ik dacht: ja, dit ding begrijpt mij. Dat gevoel gaf het me.

393
01:00:21.714 --> 01:00:31.144
Het werd alleen maar beter. Het werd echt alleen maar beter. En toen was het klaar. Hij was ook de hele tijd aan het hinten naar: nou, laatste vraag, uh, vertel, praat vooral verder als je zin in hebt.

394
01:00:31.164 --> 01:00:38.304
Maar hij was het soort van aan het-- ik vind dat dus op congressen altijd heel chill als mensen die je niet kent bij je komen en zeggen: ik heb één, ik heb één vraag.

395
01:00:38.884 --> 01:00:44.684
Eigenlijk geven ze je daarmee toestemming om het gesprek ieder moment te onderbreken. Is gewoon best wel prettig. Hoe dan ook, dat ding deed dat bij mij.

396
01:00:45.584 --> 01:00:55.564
En, uh, toen merkte ik dus dat ik zei: ja, maar ik, uh, ik zei: ik had eerlijk gezegd verwacht dat ik ook nog wel wat zou leren van jou. Dus ik had een gesprek gehad.

397
01:00:55.664 --> 01:01:04.864
Ik had verteld-- hij vroeg waar ik me het meeste zorgen over maakte met gewoon AI in de brede zin van het woord. Hij heeft heel veel gehaald bij jou. Ja. In dat interview eigenlijk, want het is een interviewtechniek. Ja.

398
01:01:05.244 --> 01:01:08.744
Maar jij voelde je ook een beetje bestolen. Ja, ik dacht wel, ik, ja, dus dat zei ik letterlijk.

399
01:01:08.804 --> 01:01:23.464
Ik zei: ik heb jou net verteld wat ik eng vind aan AI in de wereld, namelijk: ik denk dat ik zelf best wel flexibel ben en ook ondernemend ben en het idee heb dat ik snel kan omschakelen en dat ik ook technisch wel veel snap.

400
01:01:23.524 --> 01:01:30.764
Dus dat ik sneller dan andere mensen me kan aanpassen aan deze revolutie. Maar dat kan niet iedereen. Voor mezelf maak ik me niet zoveel zorgen, maar dat kan niet iedereen.

401
01:01:30.824 --> 01:01:41.844
Dat was een beetje mijn punt, zo van: waar ben je bang voor? Dus hij zei: nou, dank je wel. Uh, heb je nog vragen? Toen zei ik: nou, eerlijk gezegd, ik hoopte van dit ding ook wel wat van jou te leren, zeg maar.

402
01:01:41.984 --> 01:01:51.364
Ja, dat vind ik heel goed dat je dat zegt en, uh, dat kan ik ook heel goed begrijpen. Nou, hier zijn drie redenen waarom jouw manier van denken, wat je daar wel tegenover kan zetten.

403
01:01:51.404 --> 01:02:00.184
En toen, toen verschenen dus die drie blokjes tekst op mijn scherm en ik heb echt even vijf seconden naar het scherm zitten staren, zo van: fuck.

404
01:02:00.544 --> 01:02:15.384
Hij kwam echt met, uh, ik snap wat je zegt over dat je denkt dat je je snel kan aanpassen, maar als we iets hebben gezien met eerdere technische revoluties, dan is het heel onvoorspelbaar waar, hoe mensen zich aanpassen, waarom mensen zich aanpassen en hoe dat precies gaat.

405
01:02:15.414 --> 01:02:33.284
Hij zei eigenlijk, er was een soort zinnetje bij waarin die, zonder het zo te zeggen, maar dat zat er wel onder, dat hij eigenlijk zei: het is een beetje, het is een tikkie uit de hoogte hoe jij redeneert over dat jij, hoe slim jij zelf denkt met AI in technologische, uh, verandering te zijn versus andere mensen.

406
01:02:33.304 --> 01:02:39.664
Want dat is niet hoe dit, dat is niet hoe diffusi werkt, dat je, uh, uh, je flexibel kan opstellen per se.

407
01:02:40.564 --> 01:02:49.184
Dus hij was de hele tijd een soort van combinatie van speldeprikjes aan het leveren, waardoor ik het nog meer serieus ging nemen en, uh, gewoon vet goede inhoudelijke repliek.

408
01:02:49.644 --> 01:02:59.164
Dat ik echt even zat: wat, wat gebeurt hier en wat is, waarom voelt dit zo? Waar, ik kan niet anders beschrijven dan vibes. Waarom voelt dit zo anders dan met een gewone chatbot praten?

409
01:02:59.174 --> 01:03:12.784
Precies, en ik ben dus heel erg gefascineerd. Ik ga toch even die verbinding maken weer met het puntje hiervoor van poetic. Is, heeft, uhm, kijk, ik ben inmiddels van de school: prompten is software schrijven.

410
01:03:13.304 --> 01:03:19.464
En daarmee bedoel ik niet: je kunt met AI software maken. Nee, de prompt die jij levert is als een stuk software.

411
01:03:20.184 --> 01:03:37.004
En, uh, net als dat als jij, uh, als er een nieuw Nintendo-spel uitkomt, dan kan jouw Nintendo Switch een heel ander apparaat voelen omdat het softwaremakers gelukt is op precies dezelfde console, niemand heeft iets aan hoeven passen aan jouw Switch, zulke slimme programmeercode dat jij ineens Mario Kart aan het spelen bent.

412
01:03:37.114 --> 01:03:40.564
Precies dezelfde Switch en het bestond nog niet daarvoor en niks aangepast aan je Switch.

413
01:03:40.964 --> 01:03:48.604
Als jij de prompt ziet als Mario Kart, namelijk alsof je een spelletje in de AI stopt en die hele AI verandert ineens in wat anders. Ja.

414
01:03:48.644 --> 01:04:01.294
Dus dan hebben we het niet meer over: ja, prompt is wel chill, want dan kan je een klein beetje sturen. Uh, uh. Je kunt nieuwe AI maken met prompts. Heeft dan hier Anthropic, uh, is, was dit, uh, Claude 4.6?

415
01:04:01.804 --> 01:04:11.704
Heb jij eigenlijk al met een beter model zitten praten? Kan, hè? Was dit Claude 4.5 Opus met een fantastisch zieke scaffold, dus stiekem een, een combinatie van agents.

416
01:04:11.744 --> 01:04:22.204
Jij praatte met zeven AI's tegelijk zonder dat je het doorhebt, die aan het gokken waren op de achtergrond wie antwoord mocht geven, of was het enkel en alleen een prompt? Ja. Was het alleen maar een system prompt? Ja.

417
01:04:22.244 --> 01:04:32.104
En dan nog, hè, als ik terugkom op prompten is software schrijven. Zou het kunnen dat je zonder een ander model, zonder een superman pack, Ja, ja, ja. gewoon door een megagoede prompt, uh, dat had kunnen doen.

418
01:04:32.144 --> 01:04:42.504
Nou, en, en potentieel dus, zelfs al is het het eerste namelijk gewoon, of het laatste bedoel ik, gewoon een simpel prompt, dan, zeg maar, dit, de, de, dit was zo'n belangrijke ervaring voor mij.

419
01:04:42.544 --> 01:04:50.064
Want niet alleen praatte ik voor het eerst eigenlijk met een taalmodel, best wel een moment. Ik praatte voor het eerst met een taalmodel waarbij ik aan het chatten was, doorhad: ik ben dit aan het doen.

420
01:04:50.124 --> 01:05:01.344
Ik ben zo iemand nu die met een AI aan het chatten is, zoals al die gekkies die verliefd worden op hun AI. Uhm, dit ben ik nu aan het doen. Ik ben me er bewust van en het is toch alsnog heel erg leuk.

421
01:05:01.744 --> 01:05:04.904
En twee dacht ik: jeetje, maar dit is natuurlijk hoe onderzoek gaat werken.

422
01:05:05.144 --> 01:05:19.604
Dit is de telefonische enquête on steroids en dit is de, weet je, ieder, iedere werkgever wil de hele tijd feedback van zijn kol-, van zijn personeel, uh, over of iemand, uh, nog tevreden is in, in, in, in het werk.

423
01:05:19.684 --> 01:05:24.224
Of iedere krant wil weten of ze nog betrouwbaar gevonden worden door de lezers.

424
01:05:24.264 --> 01:05:36.064
En dit g-, stiekem gebeurt dit natuurlijk de hele tijd en ik dacht: ja, dit is hoe het gaat zijn, dit is, dit motiveert mij om jou de waarheid te vertellen over hoe ik echt denk in plaats van hoe tot nu toe dingen gaan.

425
01:05:36.104 --> 01:05:48.344
Namelijk eigenlijk praten met, eigenlijk, hoe marktonderzoek nu wordt gedaan is natuurlijk dat je praat met een soort robotachtig mens, namelijk iemand die een la-, vragenlijst afwerkt. Helemaal niet leuk.

426
01:05:49.044 --> 01:06:02.304
Terwijl hier praten we met een mensachtige robot en het is veel leuker. Ik ben veel eerlijker. Nou ja, dat. En ik denk dat misschien nog een, uh, een laatste om het, uh, uh. Trek jij hier eens een strik omheen. Nou,

427
01:06:03.484 --> 01:06:12.764
ik had ook nog wel een grappig moment. Ik ga het proberen kort te houden, maar ik was met Walter Living aan het praten. Walter Living was voorheen: je bent op zoek naar een huis. Het is een website voor de huurmarkt.

428
01:06:12.804 --> 01:06:24.584
Ja, een website. Typ je adres in of de, uh, de link van de Funda-advertentie van je woning. Ja. En je krijgt een gaaf, mooi uitziend pdf-rapport met daarin wat een goei-goed bedrag is om te bieden.

429
01:06:24.664 --> 01:06:35.476
Dingen waar je op moet letten. Best wel tof. Dat doen ze al een pa-een paar jaar.Het is een soort dienst die jou helpt om een huis. Een aankoopmakelaar. Een aankoopmakelaar die jou helpt met informatie verzamelen.

430
01:06:35.516 --> 01:06:43.596
Ja, en dan draai je altijd gewoon lekker rapportjes uit van allerlei woningen die je interessant vindt en dan doen ze wat informatie bij. Ja, ja, of, of de prijs eigenlijk goed is, wat je onderhandelruimte is.

431
01:06:43.616 --> 01:06:47.656
Ja, en dan kijken ze natuurlijk ook in het kadaster wat er allemaal verkocht is in de laatste maanden om een beetje.

432
01:06:47.916 --> 01:06:58.456
Ja, je ziet hem voor je, maar die hebben nu een beetje geforceerd, vind ik, hè, mochten jullie luisteren, een beetje geforceerd een chatbot toegevoegd en ik dacht: meh, laat me gewoon die PDF's maken man.

433
01:06:58.796 --> 01:07:02.736
Ik ben, ik ben 39, ik wil gewoon PDF's. Ik wil niet met een chatbot praten. Ja, ja.

434
01:07:02.756 --> 01:07:09.516
Maar op een gegeven moment werd hij zo in mijn neus geduwd dat ik dacht, want ik denk: dat ding is matig, dat kan niet goed zijn, zeg maar. Dat ik dacht: oké, weet je wat?

435
01:07:10.176 --> 01:07:16.336
Want het, het knopje met, uh, download je PDF werd op een gegeven moment [gniffelt] weggehaald, dus ik moest dan aan die chat vragen: geef me die PDF.

436
01:07:16.776 --> 01:07:26.536
En toen raakte ik in gesprek en toen merkte ik: oeh, oh, dit is echt niet alleen maar even een system prompt. Hier zitten allerlei MCP's achter die met Funda en het kadaster kunnen praten. Oeh, dit hebben ze nice gedaan.

437
01:07:26.576 --> 01:07:35.366
Dus ik zei op een gegeven moment: oké, deze woning daar en daar, help me out. Dat zei ik gewoon. Ja. En dat ding, oké, ik ben nu dat aan het uitlezen op de achtergrond.

438
01:07:35.396 --> 01:07:43.086
Je ziet ook allemaal mooi visueel wat hij allemaal aan het doen is. Het is gewoon een, een, een, een grounded agent die op de achtergrond al die data kan ophalen. Relevante data kan ophalen.

439
01:07:43.116 --> 01:07:51.496
Ja, je bent in gesprek met ChatGPT, die wel alle koppelingen heeft die Argil dat hij nodig heeft om dit eigenlijk goed te kunnen. Zoals het kadaster, wat nu gewoon niet kan met ChatGPT. Precies.

440
01:07:51.596 --> 01:07:59.076
En, of, je moet, nee, dat kan niet en anders zou je heel veel moeten betalen en dat gaat, zit daar natuurlijk allemaal mooi in. En toen begon hij zo'n beetje te praten. Zei hij van: oké, ik heb het huis gezien.

441
01:07:59.756 --> 01:08:06.776
Ja, ik vind wel die prijs die nu op Funda staat is echt een lokkertjesprijs, dus ik zou een beetje opletten. En toen dacht ik: fuck it. Dus ik zo: lokkertjesprijs. Ja, dit, dit en dat.

442
01:08:06.816 --> 01:08:14.196
En, uh, dus ik zei: oké, maar kan, weet je dan ook huizen waar je van zegt dat die prijs wat eerlijker is? Ja, hoor, ik zal even in de omgeving zoeken. En ik, ik was dus, ik werd een beetje gegrepen. Ja.

443
01:08:14.276 --> 01:08:21.176
En ik, ik, daarom, ik kom hierop omdat ik uit jouw verhaal ook haal dat je eigenlijk weet wat de goochelaar doet, hè.

444
01:08:21.216 --> 01:08:30.636
We zitten hier zo te, te lang al en te diep in, jij en ik, dat je het eigenlijk al bijna niet meer kan zien, hè. Je ziet de technologie te veel, maar te weinig nog wat er aan de achterkant of aan de voorkant gebeurt.

445
01:08:31.136 --> 01:08:37.396
En jij bent eigenlijk in jouw gesprek met Cloud Research in een soort interview terechtgekomen wat jou een beetje gegrepen heeft.

446
01:08:37.796 --> 01:08:47.936
En er kwam zelfs best wel feedback uit naar jouzelf toe dat je dacht: jeetje, wat is dit nou? En ik zat dus een beetje met die, uh, uh, Walter Living bot te praten en ik merkte van. Dit is nieuw.

447
01:08:48.216 --> 01:08:57.716
Ja, en dit is ook best wel, best wel nice, zeg maar, van als, uh, die combinatie van data, gewoon goede data, waar zij natuurlijk dealtjes voor gemaakt hebben.

448
01:08:58.236 --> 01:09:04.476
Plus een, een prompt die daarbij bedacht is, waar zij heel goed van begrijpen hoe, hoe dit systeem eigenlijk gebruikt wordt.

449
01:09:04.616 --> 01:09:12.616
Uh, werd, was, voelde voor mij wel als, we hebben een beetje de, we zitten nu nog in, heel erg in: ik wil AI binnen mijn website, hè. Ik ben, ik ben een klant.

450
01:09:12.656 --> 01:09:19.556
Ik wil, hè, zet maar een bolletje in de hoek, dan kan je praten met de website. Vind ik een beetje makkelijk. Daar, dat is nog de meeste AI die ik nu zie.

451
01:09:20.316 --> 01:09:33.716
Naar de volgende stap is op maat gemaakte, echt tailored zeg maar, mooi op maat gemaakte interacties die voor mij als eindgebruiker voelen: oh, dit heb ik nu eigenlijk liever nog dan die PDF. Ja.

452
01:09:33.816 --> 01:09:36.756
Eigenlijk was die PDF altijd een soort matig gemiddeld middenpunt.

453
01:09:37.076 --> 01:09:50.276
Nou, en de, de, de, d-, wat we, wat we nu waarschijnlijk gaan zien is dat je dus allemaal AI-ervaringen hebt die ingebouwd zijn in tooling die je al gebruikt, zoals in dit geval deze huizenzoeksite,

454
01:09:51.216 --> 01:10:04.376
die qua databronnen gewoon helemaal geoptimaliseerd zijn voor het concrete probleem wat jij hebt. En ik moet, i-ik, ik denk dit ook vaak over wat ik zou willen van uitgevers, dus van een krantenabonnement.

455
01:10:04.616 --> 01:10:14.656
Nu is het zo dat als je een abonnement hebt op de Volkskrant, krijg je daar ook Het Parool en weet ik veel, Trouw en al die kranten bij. Dat hoort dan bij je abonnement, maar het zijn allemaal losse silo's

456
01:10:16.036 --> 01:10:21.736
die eigenlijk ge-, een interface hebben die geoptimaliseerd is voor het nieuws van vandaag. Dus dat is wat de krant is.

457
01:10:21.766 --> 01:10:31.936
Het is nieuws van vandaag en er zit wel een zoekbalk bij, maar dan kun je bij één krant zoeken en je kan, ja, het is een soort van random ranking en er moeten losse artikelen in om data op te halen.

458
01:10:32.586 --> 01:10:44.396
Terwijl ik zou eigenlijk, wat ik nu vraag aan chat, namelijk: leg mij eens uit hoe het nou eigenlijk zit met die stikstofcrisis. Dan krijg ik eigenlijk een antwoord gebaseerd op gratis journalistiek.

459
01:10:44.426 --> 01:10:55.916
Terwijl wat ik wil is dat dat ding de archieven van de Volkskrant en van de Trouw en dan zelf bedenkt: nou, hier pak ik die primeur van de Trouw. Of die hebben hier iemand gesproken, een wetenschapper die,

460
01:10:56.936 --> 01:11:01.516
uh, precies iets zegt wat tegengesteld is aan wat dit, in dit artikel in de Volkskrant gezegd wordt.

461
01:11:01.996 --> 01:11:10.536
Dat, dat die eigenlijk de, de, uh, de tekst die onder water beschikbaar is voor in dit geval DPG, maar dat kunnen ook andere uitgevers zijn,

462
01:11:11.476 --> 01:11:20.176
dat dat de bron wordt van de kennis die ik vraag en daar wil ik ook best voor betalen eerlijk gezegd, zoals ik voor Walter Living ook betaal. Of zoals je voor Walter Living ook betaalt als je een huis gaat zoeken.

463
01:11:20.266 --> 01:11:29.596
Precies. Wil ik dit eigenlijk ook voor mijn, kijk, research is een veel te zwaar woord. Ik heb gewoon soms vragen over het leven waarvan ik denk: de. Noem het de desk research.

464
01:11:29.666 --> 01:11:37.476
Ik bedoel, je zit een beetje op je bureau door wat dingen. Nee, maar het zit, het is ook gewoon, het is ook: help me met kiezen of help me met. Jij wilt gewoon dat hij ook even door.

465
01:11:37.516 --> 01:11:44.576
Kwalitatieve informatie als bron kunnen gebruiken. Ook de Consumentenbond er gewoon bij kan pakken. Precies, ik heb er zo'n zin in.

466
01:11:44.736 --> 01:11:53.136
Ja, en dan, en dan is het misschien uiteindelijk, hè, als het dan lukt binnen dat consortium van MCP, wat dan nu blijkbaar een protocol is geworden onder, uh, stewardship. Je gaat nu die strekking om me heen gooien.

467
01:11:53.176 --> 01:12:01.816
Ik hoor, ik geloof het. Daar zit ook iets van authenticatie in. Wil je niet gewoon uiteindelijk kunnen zeggen: ik heb een abonnement op de Consumentenbond. Ik betaal voor de Volkskrant.

468
01:12:01.936 --> 01:12:11.796
Ik wil ook nog wel betalen voor het Volkskrant archiefabonnement. Ja. Laat mij nou, laat nou mijn AI MCP-calls doen naar die da-- en ik, ik, ik heb daar gewoon een abonnement op. En weet je wat?

469
01:12:11.826 --> 01:12:19.376
Desnoods zijn het zeven microtransactions. Tel ze maar op. Ik klik op Mollie en ik betaal €17. Zou je als bedrijf moeten maken om per artikel te betalen. Top.

470
01:12:20.336 --> 01:12:27.476
Wij danken Sam Hingeveld voor de edit, Pankrath voor de vormgeving. Als je een lezing wil van Nier Hagen of van mij, dan kan dat mailen ons op lezing@aireport.email.

471
01:12:27.656 --> 01:12:36.856
Wil je tips en trucs krijgen om AI te gebruiken, het nieuws krijgen week per week en recensies van de beste AI-tools? Dan abonneer je op onze nieuwsbrief via aireport.email.

472
01:12:37.516 --> 01:12:48.256
En wil je vandaag beginnen met AI binnen jouw bedrijf, dan ga je naar deptagency.com/aireport. Dan helpen zij je verder. Dank voor het luisteren en tot volgende week. Tot volgende week.

473
01:12:49.236 --> 01:13:04.226
[muziek]