Bing

Gumagawa ang Microsoft Research ng system na may kakayahang awtomatikong bumuo ng mga "matalinong" caption

Talaan ng mga Nilalaman:

Anonim

Tiyak na nakatagpo ka ng caption na nakakalito, hindi tama, o kakaunti ang sinasabi tungkol sa larawang tinutukoy nito; at posible pa nga na, kung ilalaan mo ang iyong sarili sa paglalathala ng sarili mong mga artikulo, makikita mo itong pinaka nakakapagod upang punan ang seksyong ito. Well, ang mga tao mula sa Redmond ay gumawa ng tool na naglalayong gawing mas madali ang mga bagay para sa iyo.

Isang akda na inilathala ng Microsoft Research na naglalarawan sa sarili nito bilang isang “caption generation system” na may kakayahang gayahin ang mga katangian ng pagsasalaysay ng wika ng tao, iyon ay, isang teknolohiya na maaaring maglarawan ng mga screenshot na parang tungkol sa isa sa atin, kasama ang kaukulang konteksto nito.Isang bagay na matagal nang ginagawa ng mga kumpanya tulad ng Facebook, Microsoft at Google, ngunit sa pagkakataong ito ay lampas na ito sa inaasahan.

Ano ang binubuo nito

Napakasaya niya

Sa ganitong paraan, ang system ay may kakayahan kahit na magkuwento ng isang kumpletong kuwento mula sa ilang mga larawan, na naglalarawan dito at nagsasabi na parang ito ay isang libro. Isang utility na, ayon sa mga eksperto, ay maaaring maging isang feature na nagbibigay ng higit na human touch sa ilang partikular na application, voice recognition application, awtomatikong bumubuo ng mga paglalarawan sa ibang mga lugar at marami pang iba.

At ang katotohanan ay ang tool ay hindi limitado sa pagsasabi, sa madaling sabi, kung ano ang "nakikita" nito, bagkus ay nagbibigay ng mas malawak na konteksto ng sitwasyon na makikita sa larawan, na nakakamit ng "konteksto ng pagsasalaysay at natatanging istilo ng pagsasalaysay", paliwanag ni Frank Ferraro, isa sa mga may-akda ng gawaing ito.Upang ilagay ang ating sarili sa isang sitwasyon, binibigyan niya tayo ng malinaw na halimbawa

Ipinagmamalaki siya ng kanyang ina

Kaya, nagmumungkahi ang sumusunod na kaso: “Isipin natin na mayroon tayong photo album ng ilang kaibigan na nagdiwang ng kaarawan sa isang Pub. Ang ilan sa mga unang larawan ay nagpapakita ng mga taong nag-o-order ng beer at umiinom nito, habang ang mga huli ay nagpapakita ng isang taong natutulog sa isang sofa”, komento niya.

A conventional system “maaaring tumuro lang sa isang bagay na parang may isang taong nakahiga sa isang sofa, habang ang aming system ay maaaring isama na malamang na sila ay nasa ganoong sitwasyon dahil sila ay lasing pagkatapos uminom ng kaunting inumin ” . Isang karagdagan na nagbibigay ng understanding at isang partikular na emosyonal na singil na makikita rin sa pamamagitan ng mga larawan at caption ng larawan na kasama sa artikulong ito.

Via | MIT Technology Review

Sa Xataka Windows | Naglunsad ang Microsoft ng app na tumutukoy sa lahi ng iyong aso

Bing

Pagpili ng editor

Back to top button