Op 23 juni 2026, tijdens de Volcano Engine FORCE-conferentie 2026, kondigde ByteDance Seedance 2.5 aan, de volgende generatie van zijn AI-videomodel. Eén cijfer ging sneller het internet over dan al de rest: 30 seconden. Geen 30 seconden die aan elkaar geplakt zijn uit losse clips. Dertig seconden native, doorlopende generatie in één pass, inclusief scènewisselingen en tempoveranderingen. In een vakgebied waar de meeste modellen je nog altijd 5 tot 10 seconden per keer voorschotelen, is dat het soort sprong dat de verwachtingen volledig opnieuw ijkt.
Maar een kop op de lanceringsdag is nog geen benchmark. Dus deden we wat we altijd doen voordat we een tool aan een klant aanraden: we gingen naar de primaire bronnen (de eigen tech reports van ByteDance Seed, de arXiv-papers, de aankondiging van Volcano Engine en de live Artificial Analysis Video Arena) en verdeelden de beweringen in drie bakjes: geverifieerd, door het bedrijf beweerd, en nog niet bekend. De korte versie: de Seedance-lijn is op dit moment echt de beste ter wereld op onafhankelijke ranglijsten met blinde stemmen, de claim van 30 seconden is reëel maar nog altijd een bedrijfsbewering voor een model in bèta, en de meeste harde 2.5-specs (resolutie, fps, prijs) bestaan publiek simpelweg nog niet. Dit is de data, mét bronnen, waar makers en bedrijven echt op kunnen bouwen.
Wat ByteDance werkelijk heeft aangekondigd (het geverifieerde deel)
Haal de demo's weg en slechts vier dingen over Seedance 2.5 staan op dit moment vast. Ze komen van de conferentie zelf, gerapporteerd door meerdere media die dicht bij het evenement zaten (BigGo Finance, The Decoder, AIBase) en zijn over die bronnen heen bevestigd.
| Seedance 2.5, wat er daadwerkelijk bevestigd is | Detail | Zekerheid |
|---|---|---|
| Aangekondigd | 23 juni 2026, op de Volcano Engine FORCE-conferentie 2026 (door Volcano Engine-president Tan Dai) | Geverifieerd (evenement) |
| Beschikbaarheid | Wereldwijde enterprise-bèta nu, algemene beschikbaarheid voorzien voor begin juli 2026 | Door het bedrijf aangekondigde planning |
| Kernfunctie | Directe output in één pass van een native clip van 30 seconden, één doorlopende generatie met scène- en tempoveranderingen, niet achteraf aan elkaar geplakt | Door het bedrijf beweerd |
| Referentie-inputs | Accepteert tot 50 multimodale referentiematerialen in één generatie (tegenover 12 in Seedance 2.0) | Door het bedrijf beweerd |
| Resolutie / fps / audio voor 2.5 | Niet officieel bekendgemaakt bij de aankondiging | Onbekend (niet veronderstellen) |
| API-prijs voor 2.5 | Niet aangekondigd tijdens de bèta | Onbekend |
Die laatste regel doet er meer toe dan welke spec ook. Iedereen die nu vol vertrouwen publiceert dat "Seedance 2.5 4K op 60fps doet voor $X per seconde" zit te gokken. ByteDance maakte de duur en het aantal referenties bekend, en bijna niets anders. We behandelen alles daarbuiten als onbevestigd tot het tech report bij de algemene beschikbaarheid begin juli verschijnt.
De kop, in één regel
Een clip van 30 seconden in één doorlopende generatie, vanuit tot 50 referentie-inputs. Dat is de pitch van Seedance 2.5. Al het andere is nog bèta.
De enige cijfers die onafhankelijk geverifieerd zijn: de ranglijst
Hier zit de eerlijke haak, en die is indrukwekkender dan welke onverifieerbare spec dan ook. Seedance 2.5 heeft nergens een benchmarkscore. Het staat niet op de Artificial Analysis Video Arena, niet op llm-stats, nergens. Het is een paar dagen oud en in bèta, dus elke "Seedance 2.5-Elo" die je ziet rondgaan is verzonnen. We hebben de live ranglijsten zelf gecheckt.
Wat wél reëel is, en geverifieerd tegen de primaire ranglijst, is dat het vorige model, Seedance 2.0, nu al op de eerste plek ter wereld staat. Op de Artificial Analysis Text-to-Video Arena (blinde menselijke voorkeur, weergave mét audio, juni 2026) staat "Dreamina Seedance 2.0 720p" bovenaan met een Elo van 1.219, vóór HappyHorse-1.0 van Alibaba, Kling 3.0 Pro van Kuaishou en Veo 3.1 van Google, dat helemaal op plek 8 zit. Dat is de feitelijke basis voor het verhaal "Chinese AI-videomodellen leiden de wereldwijde ranglijsten", en het is de vloer waarvandaan Seedance 2.5 lanceert.
Artificial Analysis Text-to-Video Arena, Elo (mét audio, juni 2026)
De Elo-as begint bij 1.050 om de spreiding te tonen. Bron: Artificial Analysis Text-to-Video Arena, weergave mét audio, juni 2026 (onafhankelijk, blinde menselijke voorkeur). Dit is Seedance 2.0, het model vóór 2.5. Seedance 2.5 is nog niet gerangschikt.
Hetzelfde patroon herhaalt zich op de image-to-video-ranglijst. Op de Artificial Analysis Image-to-Video Arena (mét audio, juni 2026) houdt Seedance 2.0 720p opnieuw plek 1 vast met een Elo van 1.195, met Alibaba en Google daarachter. Chinese labs (ByteDance, Alibaba, Kuaishou) bezetten de volledige top van beide ranglijsten. Eén kanttekening om je scherp te houden: dit zijn de sub-ranglijsten mét audio, en de weergaven zonder audio schudden de boel licht door elkaar (HappyHorse van Alibaba kruipt vooruit op text-to-video zonder audio). Lees altijd het label van de weergave. De conclusie houdt sowieso stand: de Seedance-familie is vandaag, op basis van onafhankelijke blinde stemmen, de sterkste videogenerator die bestaat, en 2.5 is de opvolger.
De stamboom van Seedance, in data
Seedance 2.5 kwam niet uit het niets. Het is de jongste stap in een snel, publiek tempo dat de kloof met de westerse labs op de ranglijsten gestaag heeft gedicht, en die nu voorbijstreeft.
- Seedance 1.0 (juni 2025) Het fundament. Tech report op arXiv (2506.09113), geïntegreerd in Doubao en Jimeng. ByteDance claimde bij de lancering plek 1 op beide Artificial Analysis-ranglijsten. De Pro-laag genereerde een clip van 5 seconden op 1080p in 41,4 seconden op een NVIDIA L20.
- Seedance 1.5 pro (december 2025) De audio-mijlpaal: native, gezamenlijke audio-videogeneratie in één pass, met lip-sync over talen en dialecten heen. Vanaf hier was geluid geen aangeplakt onderdeel meer (paper van ByteDance Seed).
- Seedance 2.0 (februari 2026) De huidige kampioen van de ranglijst. Tot 12 referentie-inputs, en het model dat nu op plek 1 staat in beide Artificial Analysis-arena's.
- Seedance 2.5 (aangekondigd 23 juni 2026, algemene beschikbaarheid begin juli 2026) De sprong naar 30 seconden in één pass, tot 50 referentie-inputs, op het moment van schrijven in enterprise-bèta.
De stack: wat zit er onder de motorkap
De Seedance-familie is een lijn van het type diffusion-transformer (DiT), en dit deel rust op sterke primaire bronnen in plaats van lanceringshype. Het tech report van Seedance 1.0 beschrijft een MMDiT-backbone met ontkoppelde ruimtelijke en temporele lagen, multimodale rotary position embeddings (MM-RoPE) en een temporeel-causale VAE, zo getraind dat één enkel model native multishot-generatie aankan en text-to-video en image-to-video gezamenlijk leert. Er is geen apart "beeldmodel" en "videomodel"; het is één verenigde architectuur.
Seedance 1.5 pro breidde dat uit tot een dual-branch Diffusion Transformer met een cross-modale gezamenlijke module, die de videoframes en de audiogolfvorm tegelijk in één pass genereert, in plaats van het geluid er achteraf bovenop te dubben. Daarom houdt de synchronisatie (lip-sync, aan handelingen gekoppelde geluidseffecten) stand. ByteDance heeft de architecturale details die specifiek zijn voor 2.5 niet gepubliceerd, maar de richting van de familie is duidelijk: langere context (nu 30 seconden), meer referentieconditionering (nu 50 inputs), en audio-videogeneratie behandeld als één enkel probleem.
Hoe het zich verhoudt tot Sora 2, Veo 3.1, Kling en Runway
Hier is het concurrentiebeeld. Lees het met één regel in gedachten: de enige onafhankelijk geverifieerde cijfers in deze tabel zijn de Artificial Analysis Elo-scores. De kolommen voor maximale duur en audio komen uit de documentatie van elke aanbieder per juni 2026 en veranderen voortdurend, dus behandel ze als richtinggevend, niet als evangelie, en verifieer ze voordat je er een productiepijplijn op bouwt.
| Model (aanbieder) | Max clip in één pass | Native audio | AA Video Arena (T2V, mét audio, jun 2026) |
|---|---|---|---|
| Seedance 2.5 (ByteDance) | 30s (aangekondigd) | Familie ja; 2.5 niet gedetailleerd | Nog niet gebenchmarkt (net aangekondigd) |
| Seedance 2.0 (ByteDance) | Korte clips, multishot | Ja (sinds 1.5 pro) | #1, Elo 1.219 |
| Kling 3.0 Pro (Kuaishou) | ~10s, verlengbaar | Ja | #3, Elo 1.106 |
| Google Veo 3.1 | ~8s typisch | Ja | #8, Elo 1.094 |
| Alibaba Wan 2.7 | Korte clips | Ja | #9, Elo 1.089 |
| OpenAI Sora 2 | Langere clips, varieert per laag | Ja | Niet in deze dataset |
| Runway Gen-4 | ~10s | Beperkt | Niet in deze dataset |
| MiniMax Hailuo 02 | ~6 tot 10s | Varieert | Niet in deze dataset |
Waarom Sora 2, Runway en Hailuo "niet in deze dataset" tonen: ze doken niet op met bevestigde Elo-cijfers op de ranglijsten die we hebben geverifieerd. We laten liever een cel leeg dan dat we een getal afdrukken dat we niet kunnen onderbouwen. Die discipline is het hele punt van dit artikel.
De addertjes waar makers en bedrijven op moeten rekenen
De technologie loopt echt voorop. De kanttekeningen zijn reëel, en een lanceringspost zal er niet mee openen.
- Het is bèta, en benchmarks staan nog uit. De claims van 30 seconden en 50 referenties zijn die van ByteDance zelf, voor een model dat het publiek nog niet volledig kan testen. Tot 2.5 op een onafhankelijke arena verschijnt, behandel je de kwaliteit als "de Seedance-lijn, waarschijnlijk beter", niet als een gemeten feit.
- De prijs is onbekend, en de cijfers die rondgaan zijn onbetrouwbaar. De prijs-per-seconde-getallen die op het web rondzweven zijn voor Seedance 2.0, en zelfs die overleefden onze verificatie niet. Begroot niets op de prijs van 2.5 tot ByteDance die publiceert voor de Volcano Engine- en BytePlus-API's.
- De API draait in China. Volcano Engine (binnenlands) en BytePlus (internationaal) routeren generaties via infrastructuur die onder Chinees datarecht valt. Voor een Europees of Frans bedrijf dat klant- of persoonsgegevens verwerkt is dat een governance-vraag om te beantwoorden vóór je iets gevoeligs verstuurt, geen detail.
- Het deepfake-risico is concreet. ByteDance zou na de lancering van 1.5 een functie voor "stem uit één enkele foto" hebben opgeschort vanwege zorgen over misbruik. Het gedrag rond watermerken en C2PA-herkomst voor 2.5 is niet bevestigd. Als je gelijkenissen genereert, is het aan jou om dat te beheren.
Onze lezing: wat Seedance 2.5 betekent voor je videoworkflow
Wat volgt is onze analyse.
De clip van 30 seconden in één pass is geen gimmick. De meeste video in de echte wereld, een productuitleg, een social ad, een openingssequentie, leeft in het bereik van 15 tot 30 seconden, en korte AI-clips aan elkaar plakken is precies waar de consistentie breekt: het gezicht van het personage verloopt, de belichting springt, de beweging hapert bij de cut. Een model dat één doorlopende generatie 30 seconden lang vasthoudt, met tot 50 referentie-inputs om personage en stijl vast te leggen, pakt frontaal de grootste productiehoofdpijn in AI-video aan. Als ByteDance levert wat het heeft aangekondigd, is dit een verandering in de workflow, geen incrementele spec-upgrade.
Voor makers en bedrijven is het praktische advies hetzelfde als voor elk AI-model dat we beoordelen. Behandel het model als een uitwisselbaar onderdeel achter je eigen proces, niet als het proces zelf. Zet de Seedance-lijn in waar die het sterkst is (het is, volgens onafhankelijke stemmen, de sterkste videogenerator die op dit moment bestaat), houd een tweede aanbieder als Veo of Kling aangesloten zodat je nooit gegijzeld wordt door één API, en los de governance-vraag rond China-hosting op voordat gevoelig beeldmateriaal er in de buurt komt. De teams die winnen met generatieve video zijn niet degenen die elke lancering achternazitten; het zijn degenen met een pijplijn die het beste model erin kan wisselen met een configuratiewijziging.
Precies zo bouwen wij AI-functies voor klanten: het model als verwisselbaar onderdeel achter interfaces en infrastructuur die je zelf beheert, per taak gekozen op kwaliteit, kosten en governance (zie ons werk). Ben je een merk, een bureau of een maker die AI-video in echte productie wil inpassen, en wil je het gedaan zien met de datadiscipline waarop dit artikel is gebouwd in plaats van lanceringsdaghype, vertel ons over je project (of neem contact op) en we komen binnen 48 uur bij je terug. Voor meer over de snel bewegende AI-stack, lees onze analyses van GLM-5.2, het beste open-weights-LLM, de medische bodyscanner van Midjourney, en SpaceX dat Cursor koopt voor 60 miljard dollar.
Belangrijkste cijfers (per 23 juni 2026)
Dit is een momentopname uit het lanceringsvenster; elk cijfer is gedateerd en zal verschuiven naarmate het model uitkomt en rivalen reageren.
- 30 seconden native clip in één pass, de kernfunctie van Seedance 2.5 (door het bedrijf beweerd).
- 50 multimodale referentie-inputs geaccepteerd in één generatie, tegenover 12 in Seedance 2.0.
- 23 juni 2026 aankondigingsdatum; algemene beschikbaarheid voorzien voor begin juli 2026.
- 1.219 Elo voor Seedance 2.0 op de Artificial Analysis text-to-video-arena, #1 ter wereld (mét audio). 2.5 is nog niet gerangschikt.
- 1.195 Elo voor Seedance 2.0 op de image-to-video-arena, ook #1.
- Juni 2025 het begin van de stamboom (Seedance 1.0), tot 2.5 in één enkel jaar.



