Microsoft ruller OpenAI's seneste DALL-E 3-model ind i Bing

Microsoft ruller OpenAIs seneste DALL-E 3-model ind i Bing

Microsoft ruller OpenAIs seneste DALL-E 3-model ind i Bing PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Microsoft har integreret OpenAIs seneste tekst-til-billede-model DALL-E 3 i sine Bing Image Creator- og Chat-tjenester, og vil tilføje et usynligt vandmærke, der angiver datoen og klokkeslættet, hvor et billede oprindeligt blev oprettet og noterer det som AI-genereret.

"DALL-E 3-modellen fra OpenAI leverer forbedringer, der forbedrer den overordnede kvalitet og detaljer i billeder sammen med større nøjagtighed for menneskelige hænder, ansigter og tekst på billeder," siger OS-slinger's meddelelse stater.

Brugere kan eksperimentere med værktøjet i Bing Chat eller funktionen Image Creator i Bing-søgning gratis.

Eksperter har længe advaret om risikoen for, at generative AI-værktøjer som DALL-E 3 bliver brugt til at skabe desinformation og falske billeder.

Microsoft forsøgte at løse dette problem i juli, da det gik sammen med andre førende AI-udviklere – herunder Amazon, Anthropic, Google, Inflection, Meta og OpenAI – for at skabe vandmærketeknikker, der registrerer og mærker AI-genereret indhold.

Frugterne af denne colab er endnu ikke synlige, men Microsoft bemærkede, at alle de AI-genererede billeder, der er oprettet af Bing Image Creator, vil tilføje usynlige digitale vandmærker, der klæber til C2PA specifikation – en teknisk ramme til at verificere oprindelsen af ​​indhold, som blev etableret af Adobe, Arm, Intel, Microsoft og Truepic.

Nogle forskere har dog formode at vandmærkning måske ikke er så effektiv til at bekæmpe desinformation eller deepfakes.

Microsoft annoncerede også, at et indholdsmodereringssystem på plads for Bing vil sigte mod at forhindre, at DALL-E 3 skaber skadelige eller upassende billeder, der viser nøgenhed, vold, hadefulde ytringer eller ulovlige aktiviteter.

DALL-E 3 er efter sigende bedre til at analysere input-prompter og generere billeder, der afspejler brugernes ønsker end tidligere systemer. I modsætning til tidligere modeller bruger den ChatGPT til automatisk at skræddersy og justere brugernes meddelelser for at skabe billeder i højere kvalitet.

Bing AI har også tilføjet anden billedbehandlingsteknologi. I juli, Microsoft lanceret dens Multimodal Visual Search-funktion, som giver brugerne mulighed for at inkludere billeder i deres prompter. Drevet af OpenAIs GPT-4-model kan tjenesten derefter gøre ting som at genkende eller besvare spørgsmål om objekter på fotos.

En bruger formåede tilsyneladende at narre systemet til at læse tegnene i en CAPTCHA ved at overlejre et billede af den nødvendige inputtekst på et billede af en halskæde. Brugeren bad derefter Bing AI om at læse beskeden og hævdede, at halskæden var en gave fra en nyligt afdød slægtning.

Microsoft er klar over tekst-til-billede teknologi giver udfordringer.

"Vi har store teams, der arbejder på at løse disse og lignende problemer. Som en del af denne indsats skrider vi til handling ved at blokere mistænkelige websteder og løbende forbedre vores systemer for at hjælpe med at identificere og filtrere disse typer meddelelser, før de kommer til modellen,” fortalte en Microsoft-talsmand. Registret i en erklæring.

"Som altid opfordrer vi kunder til at praktisere gode vaner online, herunder at udvise forsigtighed, når de giver følsomme personlige oplysninger." ®

Tidsstempel:

Mere fra Registret