RekenaarsInligtingstegnologie

Moderne rekenaar visie. Take en rekenaar visie tegnologie. Rekenaar Vision in Python

Hoe om 'n rekenaar te leer om te verstaan wat uitgebeeld in die prentjie of foto's? Dit lyk eenvoudig, maar vir 'n rekenaar dit is net 'n matriks wat bestaan uit nulle en ene waaruit jy wil om belangrike inligting te onttrek.

Wat is rekenaar visie? Dit is die vermoë om te "sien" jou rekenaar

Visie - is 'n belangrike bron van inligting vir die persoon wat dit gebruik, kry ons, volgens verskeie skattings, 70-90% van alle inligting. En, natuurlik, as ons wil 'n slim motor te skep, moet ons dieselfde vaardighede en rekenaar implementeer.

Die probleem van die rekenaar visie kan nogal duidelik gestel word. Wat is "sien"? Na wat verneem word, waar daar is net deur te kyk. Dat die gevolgtrekking dat die verskille van die rekenaar visie en menslike visie. Visie vir ons - dit is 'n bron van kennis oor die wêreld, asook 'n bron van metrieke inligting - dit wil sê, die vermoë om die afstande en groottes verstaan.

beeld semantiese kern

As ons kyk na die prentjie, kan ons dit beskryf deur 'n aantal eienskappe, so te sê, om semantiese inligting te onttrek.

Byvoorbeeld, kyk na hierdie foto, kan ons sê dat dit in die buitelug. Wat is die stad verkeer. Dat daar motors. Ons kan raai dat dit Suid-Oos Asië op die opset van die gebou en hiërogliewe. Die portret van Mao Zedong verstaan dat dit Beijing, en as iemand live video gesien of self daar was, sou raai dat dit die beroemde Tiananmen Square.

Wat ons meer oor die prentjie kan sê nie, want dit? Ons kan voorwerpe in die beeld te identifiseer, om te sê, dat daar mense hier nader - heining. Hier sambrele, plakkate se daardie gebou. Dit is voorbeelde van klasse is baie belangrik voorwerpe, wat betrokke is op soek vir die oomblik.

Nog kan ons 'n paar van die eienskappe of kenmerke van voorwerpe te leer. Byvoorbeeld, hier kan ons bepaal dat dit nie 'n portret van 'n gewone Chinese, naamlik, Mao Zedong.

Volgens die voertuig bepaal kan word dat dit 'n bewegende voorwerp, en dit is moeilik, wat nie tydens die beweging vervorm. Oor vlae kan gesê word dat dit voorwerpe, is hulle ook beweeg, maar hulle is nie moeilik, voortdurend vervorm. En in die toneel is daar die wind, wat bepaal kan word deur die ontwikkeling van vlae, en kan selfs die rigting van die wind, byvoorbeeld, is dit waai van links na regs te bepaal.

Die afstande en lengtes in rekenaar visie

Baie belangrik is die metrieke inligting oor rekenaar visie wetenskap. Dit is alle vorme van afstande. Byvoorbeeld, vir die Rover is veral belangrik omdat die spanne is uit die aarde sowat 20 minute en beantwoord soveel. Gevolglik is die skakel heen en weer - 40 minute. En as ons 'n plan vir beweging bevele van die aarde, wat jy nodig het om dit in aanmerking neem.

Suksesvol geïntegreer die tegnologie van die rekenaar visie in die video speletjies. Volgens die video, kan jy bou driedimensionele modelle van voorwerpe, mense, en foto's op die gebruiker kan die drie-dimensionele modelle van stede te herstel. En dan loop op hulle.

rekenaar visie - 'n taamlik wye verskeidenheid. Dit is nou verweef met verskeie ander wetenskappe. Deel van die rekenaar visie Dit vang die beeld verwerking area en soms ken rekenaar visie, histories.

Analise, patroonherkenning - die pad na die skepping van die hoogste intelligensie

Laat ons afsonderlik ondersoek hierdie konsepte.

Image Processing - dit is 'n gebied van algoritmes, waarin die toevoer en afvoer - beeld, en ons het hom iets te doen.

beeld analise - is die area van die rekenaar visie, wat fokus op die werk met die twee-dimensionele beeld en maak gevolgtrekkings uit hierdie.

Patroonherkenning - 'n abstrakte wiskundige dissipline wat data in die vorm van vektore erken. Dit is, by die ingang - vektor en ons het iets te doen met dit. Waar die vektor is, ons is nie so belangrik om te weet.

Rekenaar visie - dit was oorspronklik om die struktuur van die twee-dimensionele beelde te herstel. Vandag hierdie gebied breër geword en dit kan geïnterpreteer word as aanvaarding van al die fisiese voorwerpe maak, gebaseer op die beeld. Dit wil sê, dit is die taak van kunsmatige intelligensie.

In parallel met die rekenaar visie in 'n heeltemal ander veld, in geodesie, fotogrammetrie ontwikkel - 'n meting van die afstand tussen voorwerpe op twee-dimensionele beelde.

Robots kan "sien"

En uiteindelik - dit is masjien visie. Onder die masjien visie beteken 'n visie van robots. Dit is die besluit van 'n paar produksie probleme. Ons kan sê dat die rekenaar visie - is 'n groot wetenskap. Dit kombineer 'n paar van die ander wetenskap deel. En wanneer die rekenaar visie kry 'n bepaalde aansoek, dit verander in 'n masjien visie.

Rekenaar visie streek het 'n massa van praktiese toepassings. Dit is wat verband hou met die outomatisering van produksie. By die ondernemings word meer doeltreffend te handearbeid vervang deur masjien. Die masjien nie moeg word, nie aan die slaap, sy het onreëlmatige werkskedule, sy is bereid om 365 dae per jaar werk. So, met behulp van die masjien werk, ons kan 'n gewaarborgde resultaat te kry op 'n sekere tyd, en dit is baie interessant. Alle take moet 'n duidelike gebruik vir rekenaar visie stelsels. En daar is niks beter as om die resultate onmiddellik op die foto net in die berekening stadium sien.

Op die drumpel van die wêreld van kunsmatige intelligensie

Plus die gebied - dit is moeilik! 'N Beduidende deel van die brein wat verantwoordelik is vir visie, en dit word geglo dat as jy leer jou rekenaar te "sien", dit is, die volle gebruik rekenaar visie, dit is een van die doelwitte van volle kunsmatige intelligensie. As ons die probleem op die menslike vlak kan oplos, waarskynlik op dieselfde tyd, sal ons die probleem van AI los. Dit is baie goed! Of nie baie goed, as jy kyk, "Terminator 2".

Hoekom is visie - dit is moeilik? Omdat die beeld van dieselfde voorwerp kan wissel baie, afhangende van eksterne faktore. Afhangende van die voorwerp van waarneming punte lyk anders.

Byvoorbeeld, een en dieselfde figuur, geneem uit verskillende hoeke. En wat is baie interessant in die figuur kan een oog, twee oë en 'n half wees. En afhangende van die konteks (indien hierdie beeld van die mens in 'n hemp met geverfde oë), die oog kan meer as twee wees.

Die rekenaar het nog nie verstaan nie, maar dit "sien"

Nog 'n faktor wat dit moeilik maak - dis die beligting. Dieselfde toneel met verskillende beligting sal anders lyk. grootte voorwerp kan wissel. Verder het die voorwerpe van enige klas. Hoe kan jy sê oor 'n man wat sy hoogte van 2 meter? Niks. Menslike groei en kan wees 2.3 m, en 80 cm. Soos met ander vorme van voorwerpe, maar is voorwerpe van dieselfde klas.

Veral lewende voorwerpe ondergaan 'n verskeidenheid van stamme. Hair mense, atlete, diere. Kyk na foto's van perde wat opruk, te bepaal wat gebeur met hul maanhare en stert is eenvoudig onmoontlik. A oorvleuelende voorwerpe in 'n beeld? As jy 'n beeld rekenaar, selfs die mees kragtige masjien stoot vind moeilik om die regte besluit te gee.

Volgende siening - dit is 'n bedekte. Sommige voorwerpe, diere vermom as die omgewing, en baie bekwaam. En dieselfde kolle en kleur. Nietemin, hulle sien ons, hoewel nie altyd uit die verte.

Nog 'n probleem - die beweging. Voorwerpe in beweging ondenkbare ondergaan vervorming.

Baie van die voorwerpe is baie veranderlike. Hier, byvoorbeeld, in die twee foto's onder die oogmerke van die "stoel".

En op dit wat jy kan sit. Maar om 'n masjien, soos wat die verskillende dinge in vorm, kleur, materiaal, alles is 'n voorwerp "stoel" leer - is baie moeilik. Dit is die uitdaging. Metodes van rekenaar visie te integreer - is om 'n masjien te leer om te verstaan, te ontleed, te spekuleer.

Integrasie van die rekenaar visie in verskillende platforms

Die massa van die rekenaar visie het begin om meer te dring in 2001, toe hy die eerste gesig detector geskep. Ons het dit twee outeurs: Viola, Jones. Dit was die eerste vinnig en betroubaar genoeg algoritme, wat die krag van die masjien leermetodes gedemonstreer.

Nou rekenaar visie genoeg nuwe praktiese toepassings - erkenning van die menslike gesig.

Maar aan die man herken as in die flieks - na willekeur hoeke, verskillende lig omstandighede - dit is onmoontlik. Maar vir die probleem, of een wat verskillende mense met verskillende beligting of in 'n ander houding, soortgelyk as in die foto in die paspoort te los, is dit moontlik met 'n hoë mate van vertroue.

'n paspoort foto vereistes grootliks te danke aan die funksie van die algoritmes gesig erkenning.

Byvoorbeeld, as jy 'n biometriese paspoort, in sommige moderne lughawens, kan jy die outomatiese paspoort beheer stelsel gebruik.

Onopgeloste probleem van rekenaar visie - die vermoë om enige teks te herken

Miskien is iemand wat OCR stelsel. Een van hierdie - 'n boete Reader, is baie gewild in RuNet stelsel. Daar is baie vorms waar jy in die data vul, hulle is perfek geskandeer, die inligting word erken deur die stelsel baie goed. Maar met enige teks in die prentjie die situasie is veel erger. Hierdie probleem is nog steeds nie opgelos.

Speletjies wat rekenaar visie, motion capture

Aparte groot gebied - is die skepping van drie-dimensionele modelle en motion capture (wat baie suksesvol in rekenaarspeletjies geïmplementeer). Die eerste program, wat rekenaar visie gebruik - 'n stelsel van interaksie met die rekenaar met behulp van gebare. Wanneer dit geskep was dit 'n baie van die dinge oop.

Die algoritme is ontwerp eenvoudig, maar om op te stel wat dit neem om 'n kragopwekker van sintetiese beelde van mense te skep om 'n miljoen foto's te kry. Supercomputer met hulle na die parameters van die algoritme, waarvoor hy goed werk nou kies.

Dit is 'n miljoen beelde en week aftelbare supercomputer tyd moontlik om 'n algoritme wat 12% van die kapasiteit van 'n verwerker verbruik en toelaat dat 'n persoon om die posisie in real time waarneem skep. Hierdie Microsoft Kinect stelsel (2010).

Soek vir beelde deur inhoud kan jy foto's oplaai na die stelsel, en die resultate daarvan sal al die foto's met dieselfde inhoud te gee en uit dieselfde hoek.

Voorbeelde van rekenaar visie: driedimensionele en tweedimensionele kaarte word nou gemaak met dit. Kaarte vir navigasie motors word gereeld opgedateer volgens die DVR.

Daar is 'n databasis met miljarde geocodering foto's. Deur die aflaai van die foto in die databasis, kan jy bepaal waar dit gemaak is, en selfs met 'n paar perspektief. Natuurlik, met dien verstande dat die plek is gewild genoeg dat op 'n tyd die toeriste en het 'n aantal foto's van die gebied daar gewees.

robots is oral

Robotika op die oomblik, oral, sonder dat dit op enige wyse. Nou is daar voertuie wat spesiale kameras wat voetgangers en padtekens te erken om bevele te stuur na die bestuurder (hierdie op 'n manier 'n rekenaarprogram te kan sien, help die motoris) het. En daar is 'n ten volle outomatiese robot voertuie, maar hulle kan nie net staatmaak op die video kamera stelsel sonder die gebruik van 'n groot bedrag van bykomende inligting.

Moderne kamera - dit is 'n analoog kamera obscura

Kom ons praat oor die digitale beeld. Moderne digitale kameras gerangskik op die beginsel van die camera obscura. Slegs in plaas van die gat waardeur lig gaan die balk en geprojekteer op die agterste muur van die kamer van die onderwerp kring, ons het 'n spesiale optiese stelsel bekend as die lens. Sy doel is om 'n groot ligstraal in te samel en sit dit so dat al die strale deur 'n virtuele punt geslaag om die projeksie te bekom en vorm 'n beeld op film of matriks.

Moderne digitale kameras (matriks) word saamgestel uit individuele elemente - pixels. Elke pixel kan die energie van die lig wat voorval op die pixel totale te meet, en uit te reik een uitset nommer. Daarom, in 'n digitale kamera, kry ons in plaas van die prent helderheid stel lig metings, gevang in 'n enkele pixel - die rekenaar gebied van die oog. Daarom, wanneer die beeld wat ons sien nie vloeiende lyne en duidelik kontoere, en 'n rooster van gekleurde blokkies in verskillende kleure - pixels.

Hieronder sien jy die eerste digitale beeld in die wêreld.

Maar in hierdie foto is nie? Kleur. Wat is die kleur?

Sielkundige persepsie van kleur

Kleur - dit is wat ons sien. Die kleur van die een en dieselfde ding vir mense en katte sal anders wees. Aangesien ons (die mens) en dier optiese stelsel - die visie is anders. Daarom is die kleur - dit is sielkundige gehalte van ons visie wat plaasvind wanneer die waarneming van voorwerpe en lig. En nie 'n fisiese eienskap van die voorwerp en die lig. Kleur - is die gevolg van die interaksie van lig komponente, en die toneel van ons visuele stelsel.

Rekenaar Vision in Python met behulp van biblioteke

As jy besluit het om ernstig te betrek in die studie van die rekenaar visie, moet onmiddellik voor te berei vir 'n aantal probleme, hierdie wetenskap is nie die maklikste en huide 'n aantal slaggate. Maar "Programming Computer Vision op die Python" die outeurskap van Jan Erik Solema - 'n boek wat al die mees eenvoudige taal beskryf. Hier sal jy kennis maak met die metodes van erkenning van verskillende voorwerpe in 3D, leer om te werk die stereo beeld, virtual reality en baie ander programme van rekenaar visie met. In die boek is genoeg voorbeelde in Python. Maar die verduidelikings word, so te sê, veralgemeen, sodat dit nie te veel navorsing en harde data oorlaai. Werk wat geskik is vir studente, amateurs, en entoesiaste. Laai hierdie boek en ander oor die rekenaar visie (pdf-formaat) kan wees in die netwerk.

Op die oomblik is daar open source biblioteek van rekenaar visie algoritmes en beeldverwerking en numeriese algoritmes OpenCV. Dit is geïmplementeer op die meeste moderne programmeertale, is open source. As ons praat oor rekenaar visie, Python gebruik as 'n programmeertaal, dit het ook die ondersteuning van die biblioteek, benewens, dit is voortdurend in beweging en het 'n groot gemeenskap.

Die maatskappy "Microsoft" bied sy dienste Api-in staat om die neurale netwerk op te lei om dit te werk met beelde van mense. Daar is ook die geleentheid om rekenaar visie van toepassing, Python gebruik as 'n programmeertaal.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 af.delachieve.com. Theme powered by WordPress.