Advertentie
Microsoft heeft SpreadsheetLLM onthuld, een AI-taalmodel dat speciaal is ontwikkeld voor spreadsheetprogramma's zoals Excel en Google Sheets. Een groep Microsoft-onderzoekers bespreekt de voordelen van dit llm in een paper. Het is niet bekend of en wanneer Microsoft van plan is om deze functionaliteit beschikbaar te maken voor het grote publiek.
In het onderzoeksartikel wordt aangegeven dat spreadsheets lay-outs en opmaak kunnen bevatten met veel verschillende vormen en opties. Dit kan voor problemen zorgen bij standaard AI-gebaseerde llm’s op het gebied van token-beperkingen, de basiseenheid die wordt ingezet om gegevens te verwerken. Een token-limiet bepaalt hoeveel informatie in een enkele interactie kan worden verwerkt. Daarnaast kan ook het begrijpen van spreadsheet-specifieke functies zoals cel-adressen en -formaten problematisch zijn.
Het Microsoft-team heeft SpreadsheetLLM ontworpen om te proberen deze uitdagingen te overwinnen. Het model bestaat uit drie modules: structural-anchor-gebaseerde compressie, inverse index-vertaling, en dataformaatbewuste aggregatie. Het zorgt naar eigen zeggen voor aanzienlijk betere prestaties wat betreft het detecteren van spreadsheet-tabellen. Zo wordt een uplift van 25,6% geclaimd ten opzichte van de in-context leeromgeving van OpenAI's GPT4. Daarnaast ontwikkelde het team de SheetCompressor, die spreadsheets comprimeert om ze effectiever te kunnen verwerken via het nieuwe llm.
Er zitten nog wel enige beperkingen aan dit model, waaronder als een spreadsheet een achtergrondkleur of randen gebruikt. Het verwerken hiervan zou teveel tokens kunnen innemen. De SheetCompressor kan op dit moment ook geen cellen comprimeren die natuurlijke taal bevatten.