Na iPhone 5 bude možné zadávať údaje a získavať výsledky hlasom

O záujme Applu o technológie na rozpoznávanie hlasu a AI sa vie už relatívne dlho. Súviseli s tým rôzne akvizície na takýto softvér zameraných firiem (Siri) a naznačovali to aj rôzne patenty a podobne. Na veľmi zaujímavú informáciu nás však upozornil čitateľ Michal, ktorého letná brigáda priamo súvisela s pripravovanou novinkou od Apple. Jej náplňou bolo nahrávanie 400 hlasových príkazov. Akciu organizovala agentúra najatá spoločnosťou Apple a príkazy sa nahrávali aj v interiéri aj v exteriéri (samozrejme nie priamo s iPhone 5, ten drží Apple v tajnosti). Medzi príkazmi bolo všetko od písania SMS správ, vyhľadávania reštaurácií a podnikov v okolí, vyhľadávania trás, prehrávania hudby až po vyhľadávanie na internete.

Upozorňujeme, že nejde len o bežné hlasové rozpoznávanie, ktoré existuje na technologickom trhu už dlho, ale hlavne o umelú inteligenciu, ktorá analyzuje a rozpoznáva vaše sofistikované žiadosti a na základe toho poskytuje výsledky. Táto „inteligencia“ nemusí byť závislá na jazyku.

~~(Video vytvorené v spolupráci MacRumors.com a Jan-Michael Cart ukazuje, ako by nový Assistant mohol vyzerať)~~

Situácia so službami od Applu sa v našich končínách razantne zlepšuje a vyzerá to tak, že jedna z kľúčových noviniek iPhonu 5 – inteligentné hlasové ovládanie – bude plne podporovaná aj u nás. Viac sa o tomto „Assistentovi“ dozvieme už zajtra.

komentárov
  1. 2 Leryth & tacco
    Pochybujem, ze to bude na iPhone4 – nebudem riesit harverove naroky, aj ked si viem predstavit, ze asi potrebuje riadny vypoctovy vykon, ale proste potrebuju funkciu len pre iPhone 5(4s) ktora im ho bude predavat.

    0
    0
  2. Budem hovorit svoj nazor a len za seba.
    Pre mna osobne ovladanie hlasom nema moc buducnost.

    Aj keby sa podaril sebelepsi softver, tak si neviem predstavit, ze stojim niekde na namesti, alebo sedim v restauracii a nejaky clovek za mojim chrbtom mi ovlada moj mobil hlasom – ci uz nechtiac, alebo zo srandy. :-)

    Tiez si moc neviem predstavit, ze sedim v restauracii a je tam 20 ludi, ktori maju zariadenie ktore sa da ovladat hlasom. Jeden da pokyn a vykona sa to vsetkym v restauracii. :-)

    Dalsia situacia je, ze ste v restauracii a je tam hlucno – minimalne 10 ludi rozprava naraz. Nepoznam softver, ktory dokaze z jednej audio stopy spravit dve audio stopy, kde jedna je jeden hlas a druha je druhy hlas. A ked si predstavim, ze v jedej stope je 10 hlasov, cez to vsetko steka pes, cvirikaju vrabce a v pozadi hra hudba …. ako ten softver vie oddelit prislusny hlas, aby ho vobec mohol analyzovat ??? Ak by sa to nejakej firme podarilo – uz by som ich povazoval za laureatov Nobelovej ceny.
    Skusal som softver co z jednej audio stopy spravil noty. Ale ta audio stopa musela obsahovat zvuk jedneho nastroja a nic uz v pozadi nesmelo byt. Aj tak to nespravil dobre. By som sa potesil softveru, ktory by mi z hocijakej MP3-jky spravil partituru pre celu kapelu, alebo orchester po jednotlivych nastrojoch. Rozpoznavanie hlasu v realnom zivote je podobny problem, resp. este vacsi. Ja si myslim, ze na vyvoji sa neustale, intenzivne pracuje, ale realne potrebuju este nejakych par rokov na to, aby vzniklo nieco aspon trochu prijatelne.

    Pre mna je otazne, ze kolko ludi by takuto vymozenost naozaj pouzilo v reale. Ja osobne o tom neuvazujem aj keby to bolo uplne dokonale.

    Toť moj nazor k ovladaniu hlasom vseobecne.

    0
    0
  3. aktivo:

    Hlasovy pokyn predsa zadas az ked stlacis dvakrat home tlacidlo (alebo ine tlacidlo nejak stlacis). Telefon nezachytava nonstop nahodne nezmyselne hluky z okolia. Stlacis tlacidlo, povies prikaz a ked ho dopovies, nahravanie sa zrusi a telefon uz nechyta ziadny hlas.

    Cize polovica tvojho prispevku je uplne mimo, vlastne cely.

    Asi si vela zariadeni ovladanych hlasom este nevidel, pretoze dnesny softver a mikrofony vedia bez problemov oddelit tvoj hlasovy prikaz od hluku aj v poriadne preplnenej krcme UPLNE BEZ PROBLEMOV. Dokonca vedia rozoznat HUDBU a zistit nazov piesne v obchodnom dome kde sa to ani neda nazvat reprodukciou, ale len sumenim not niekde zo stropu.

    Takze zorientuj sa trochu vo svete :)

    0
    0
  4. aktivo: Ale to je uz docela snadne. Predstav si na jedne primce dva mikrofony a 4 zdroje zvuku. Z tech dvou stop lze uplne ciste vyfiltrovat kterykoliv jeden ze zdroju zvuku. S trochou zjednoduseni se to se tremi mikrofony da udelat v rovine. Tvoje hlava to nedokaze, technika ano.
    Je to stejny princip jako treba diverzitni/MIMO anteny u wifi routeru.

    0
    0
  5. tiez verim ze vacsina ficuriek pojde aj na 3GS..ak ano tak by sa z neho stal typ ktory bol najdlhsie upgrade-ovatelny (strasny vyraz). A teda ma sancu drzat si hodnotu este nejaky cas.
    V niektorych veciach nas ale podla mna urcite odstrihnu a OTA si vyskusame mozno pri 1-2 patchoch IOS 5.

    0
    0
  6. aktivo: opisujes problemy zpred 5 rokov. Toto vsetko je vyriesene. To, ze si nevies nieco predstavit, nech ta neznechucuje, ale podnieti k dalsiemu studiu problematiky a teda k vzdelavaniu seba sameho.

    0
    0
  7. mne medzi príkazmi chýba “Koľko je hodín”, “What is time” …keď mám iPhone vo vrecku a mám handsfree aby som nemusel vyťahovať iPhone z vrecka …a súhlasím s Palom …Aktivo množstvo vecí je už vychytaných v dnešnej dobe

    0
    0
  8. aktivo:
    I iPhone ma prece dva mikrofony. Jeden na mluveni a druhy pro okolni zvuk. A pak se jen “odecte” jeden od druheho a voila krasne cisty vstup. Ja problem vidim v tom ze lidi mluvi na mobil a opravdu nepotrebuji vedet co ostatni lide vyhledavaji nebo komu chteji volat. Je to strasna neurvalost timto ovladanim otravovat okoli. To je jako hlasite vyzvaneni, externi poslech hudby nebo hlasite se vybavovani. Proste to nikoho nezajima a vetsinu dost obtezuje.

    0
    0
  9. podľa mňa to môže byť ako napríklad telefónny hovor – spoločenský prijateľné vo väčšine situácií. Dokonca ešte viac priateľné, keďže keď si napríklad s kamarátmi, hovor je rušivý element, zatiaľ čo vyhľadanie informácie môže byť užitočné pre všetkých.

    0
    0
  10. Spíš je třeba se na tyto věci dívat co teprve přinesou, ne jak to funguje dnes a tuto technologi já nepotřebuji/ nechci. V době mizerných LCD display a neustále poztrácených hůlek na ovládání, si asi většina lidí klepala na čelo, kdyby jim někdo vykládal, jak úžasný bude ten iPad. Prostě technologie, která teprve přinese nové možnosti a způsoby života.

    Kdyby mi někdo na začátku 90-tých let, řekl, tohle se nemusíš učit, to si nezapisuj, nekupuj ty encyklopedie, jen to naťukej do Google, tak se na něj také budu usmívat.

    0
    0
  11. Těším se moc, myslím, že to bude právě hodně využitelné v autě, nebo pro ty, co nocí neustále HF v uchu.
    To Metal: I v dnešní době takových technologií si rád otevřu papírovou encyklopedii :-)

    0
    0
  12. Táto „inteligencia“ nemusí byť závislá na jazyku. ???? neverim moc tomu ze to bude v dohladnej dobbe fungovat slovensky :)

    0
    0
Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *



Články, ktoré by sa vám mohli páčiť
WWDC 24
pokračovanie článku

Apple ohlásil WWDC 2024!

Ukazuje sa, že úniky spojené s informáciami zo sveta Applu majú niečo do seba. Nedošlo však k ohláseniu nových iPadov, ale tohtoročnej konferencie WWDC '24.
Gemini
pokračovanie článku

Kto prinesie vyspelú AI na iOS 18? Apple to nebude

Koncom minulého roka sa objavila správa, podľa ktorej Apple plánuje priniesť rozšírenú AI funkcionalitu na iPhone a ďalšie zariadenia. Výraznou premenou by si mala prejsť Siri, digitálna asistentka, ktorá už skôr zaostávala za konkurentmi, vo svete GPT je však ešte archaickejšia.