컴퓨터정보 기술

현대 컴퓨터 비전. 작업 및 컴퓨터 비전 기술. 파이썬에서 프로그래밍 컴퓨터 비전

어떻게 사진 또는 그림에 묘사되어 이해하기 위해 컴퓨터를 가르 칠? 이 간단한 것 같지만 컴퓨터에 대해이 0과 1이 중요한 정보를 추출하려는 사람들로 구성된 단지 행렬이다.

컴퓨터 비전은 무엇입니까? 당신의 컴퓨터를 "인식"할 수있는 기능입니다

비전 - 그것을 사용하는 사람에 대한 정보의 중요한 원천이다, 우리는 70에서 모든 정보의 90 %를, 다양한 추정에 의하면, 구하십시오. 우리는 스마트 자동차를 만들려면 그리고 물론, 우리는 같은 기술과 컴퓨터를 구현해야합니다.

컴퓨터 비전의 문제는 아주 명확하게 진술 할 수있다. "참조"이란 무엇입니까? 보고 그냥 거기 어디 것을 알 수있다. 즉 컴퓨터 비전 및 인간 시각의 차이를 결론을 내렸다. 우리에게 비전 - 그것은 세계에 대한 지식의 원천뿐만 아니라 통계 정보의 소스가 - 즉, 능력은 거리와 크기를 이해합니다.

시맨틱 커널 이미지

사진을 보면, 우리는 의미 정보를 추출하기 위해, 말하자면, 속성 수로 설명 할 수 있습니다.

예를 들어,이 그림을보고, 우리는 야외이라고 말할 수 있습니다. 도시 트래픽은 무엇입니까. 그건 자동차가있다. 우리는이 건물과 상형 문자의 구성에 동남 아시아는 것을 추측 할 수있다. 마오 제동의 초상화이 베이징 것을 이해하고, 누군가가 라이브 비디오를보고 나 자신이 있었다면,이 유명한 천안문 광장이라고 생각합니다.

우리는 그것을보고, 사진에 대한 자세한 내용을 말할 수 있습니까? 울타리 - 우리는 사람들이 여기에 가까이 있다는 것을, 말, 이미지의 개체를 식별 할 수 있습니다. 여기 우산, 그 건물의 포스터. 이 클래스의 예 순간 검색에 종사하는 매우 중요한 객체이다 있습니다.

그럼에도 불구하고 우리는 기능이나 개체의 속성 중 일부를 배울 수 있습니다. 예를 들어, 우리가이 즉 일반 중국어, 마오 쩌둥의 초상화가 아니라는 것을 확인할 수 있습니다.

차량에 따라 움직이는 물체라고 판정하고,이 이동 중에 변형되지 않는 것이 힘들 수있다. 플래그는 객체라고 할 수있는 정보, 그들은 또한 이동하고 있지만, 하드 지속적으로 변형되지 않습니다. 그리고 장면이 플래그를 개발하여 확인할 수 있습니다 바람이다, 심지어 바람의 방향, 예를 들어, 왼쪽에서 오른쪽으로 불고을 확인할 수 있습니다.

컴퓨터 비전의 거리와 길이

아주 중요한 컴퓨터 비전 과학에 대한 통계 정보입니다. 이 거리의 모든 종류입니다. 팀은 지구에서 약 20 분 거리에 있습니다 및 많은 대답 때문에 예를 들어, 로버를 위해 특히 중요하다. 따라서, 거기에 다시 링크 - 40 분 거리에 있습니다. 우리는 지구의 이동 명령에 대한 계획을 만들 경우, 당신은이 점을 고려해야 할 필요가있다.

성공적으로 비디오 게임에서 컴퓨터 비전의 기술을 통합. 비디오에 따르면, 당신은 객체, 사람의 3 차원 모델을 구축 할 수 있으며, 사용자의 사진은 도시의 3 차원 모델을 복원 할 수 있습니다. 그리고 그들에 걸어.

컴퓨터 비전 - 다소 넓은 범위. 그것은 밀접하게 다양한 과학 얽혀있다. 컴퓨터 비전의 일부 이 화상 처리 영역을 캡처하고 때로는 역사적으로, 컴퓨터 비전을 할당한다.

분석, 패턴 인식 - 뛰어난 지능의 창조의 경로

우리가 개별적으로 이러한 개념을 살펴 보자.

이미지 처리 - 이미지, 그리고 우리에게 뭔가를이 -이 입력과 출력이되는 알고리즘의 영역입니다.

이미지 분석 - 2 차원 화상 작업이에서 결론을 도출에 초점을 맞추고 컴퓨터 비전의 영역입니다.

패턴 인식 - 벡터의 형태로 데이터를 인식하는 추상적 인 수학 분야. 즉, 입구에있다 - 벡터와 우리가 함께 할 수있는 뭔가가있다. 벡터이고, 우리가 알고 그렇게 중요하지 않습니다.

컴퓨터 비전 - 그것은 원래 두 차원 이미지의 구조를 복원하는 것이 었습니다. 오늘날이 지역은 넓은되었다 그리고 그것은 이미지에 기반하고 실제 모든 객체의 동의로 해석 될 수있다. 즉, 그것은 작업입니다 인공 지능은.

완전히 다른 분야의 컴퓨터 비전과 병행하여, 측지학에서 사진 측량은 진화 - 객체까지의 거리의 측정을 2 차원 화상에.

로봇이 "볼"수

그리고 마지막으로 -이 머신 비전입니다. 머신 비전에서 로봇의 비전을 의미한다. 즉 일부 생산 문제의 결정이다. 하나 개의 큰 과학이다 - 우리는 컴퓨터 비전 말할 수 있습니다. 그것은 다른 과학 부분의 일부를 결합합니다. 컴퓨터 비전은 특정 응용 프로그램을 얻을 때, 그것은 머신 비전으로 변합니다.

컴퓨터 비전 지역은 실제 응용의 질량을 가지고있다. 그것은 생산의 자동화와 연결되어 있습니다. 기업에서 기계에 의해 육체 노동을 대체하는 것이 더 효율적이된다. 기계는 그녀는 불규칙한 작업 일정을했다, 자고하지, 피곤하지 않고, 그녀는 365 일 일을하고자합니다. 그래서, 기계 작업을 사용하여, 우리는 특정 시간에 보장 된 결과를 얻을 수 있으며, 매우 흥미로운 일이다. 모든 작업은 컴퓨터 비전 시스템에 대한 명확한을 사용할 수 있습니다. 만 계산 단계에서 사진을 즉시 결과를 볼 수보다 더 아무것도 없다.

인공 지능의 세계의 문턱에

게다가이 지역은 - 그것이 어렵다! 비전을 담당하는 뇌의 중요한 부분은, 여러분이 가르치는 경우 컴퓨터 즉, 전체 사용 컴퓨터 비전, 그것은 전체 인공 지능의 목표 중 하나입니다, "을 참조하십시오"하는 것으로 생각된다. 우리는 인간의 수준에서 문제를 해결할 수 있다면, 같은 시간에 대부분, 우리는 AI의 문제를 해결합니다. 즉 매우 좋다! 또는 매우 좋지 않아, 당신이 보면, "터미네이터 2".

왜 비전은 - 그것은 어렵다? 동일한 피사체의 화상이 크게 변할 수 있으므로, 외부 요인에 따라. 관측 지점의 목적에 따라 다르게 보일.

예를 들어, 하나의 동일한 도면의 경우, 서로 다른 각도에서 촬영. 그리고 한쪽 눈, 두 눈 반 될 수있다 그림에서 가장 흥미로운 것입니다. 그리고 상황에 따라서는 (그린 된 눈을 가진 남자의 셔츠의이 이미지는 경우), 눈은 두 개 이상이 될 수 있습니다.

컴퓨터가 여전히 이해하지 않지만, "인식"

어렵게 만드는 또 다른 요인은 - 그것은 조명입니다. 다른 조명과 같은 장면이 다르게 나타납니다. 객체의 크기는 다를 수 있습니다. 모든 클래스의 또한, 객체. 당신은 2m의 자신의 높이 사람에 대해 말할 수 있습니까? 아무것도. 인간 성장은 2.3 m 및 80cm 일 수있다. 다른 유형의 객체와 같이, 그러나, 동일한 클래스의 오브젝트이다.

특히 생물체는 균주의 다양한 받다. 머리는 사람, 운동 선수, 동물. 자신의 갈기 일어나고와 꼬리는 단순히 불가능하다 결정, 실행하는 말의 사진을보십시오. 화상에 중첩 오브젝트? 당신은 컴퓨터 이미지, 심지어 가장 강력한 기계를 밀어 경우 올바른 결정을주는 어려움을 찾을 수 있습니다.

다음보기 - 그것은 변장입니다. 일부 개체는, 동물은 매우 능숙 환경 인척합니다. 그리고 같은 반점과 색상. 그럼에도 불구하고, 우리는 항상 비록 멀리서 그들을 참조하십시오.

또 다른 문제 - 운동. 상상할 수없는 동작의 객체는 변형을 겪는다.

객체의 대부분은 매우 다양하다. 여기에, 예를 들어, "의자"의 대상 아래의 두 사진입니다.

그리고 이것은 당신이 앉아 있습니다. 그러나 모양, 색깔, 재료의 여러 가지가, 모든 객체 "의자"가되도록 기계를 가르치는 것은 - 매우 어렵습니다. 이것은 도전이다. 컴퓨터 비전의 방법을 통합하려면 - 추측 이해하고 분석하는 기계를 가르치는 것입니다.

다양한 플랫폼에서 컴퓨터 비전의 통합

컴퓨터 비전의 질량은 자신이 제 1면 검출기를 만들 때, 2001 이상의 침투하기 시작했다. 비올라, 존스 : 우리는 두 저자했다. 그것은 기계 학습 방법의 힘을 보여준 최초의 빠르고 안정적인 충분히 알고리즘이었다.

이제 컴퓨터 비전은 충분히 새로운 실용적인 응용 프로그램을 - 인간의 얼굴을 인식.

그러나 영화로 사람을 인식하는 - 임의 각도, 다른 조명 조건에서 - 그것은 불가능하다. 그러나 문제, 또는 다른 조명 또는 여권의 사진에서와 유사한 다른 포즈에서 다른 사람들의 일을 해결하기 위해, 그것은 높은 신뢰도 가능합니다.

얼굴 인식 알고리즘의 기능에 크게 인해 여권 사진 요구 사항.

당신은 생체 인식 여권이있는 경우 예를 들어, 일부 현대 공항, 당신은 자동 여권 제어 시스템을 사용할 수 있습니다.

컴퓨터 비전의 미해결 문제 - 어떤 텍스트를 인식 할 수있는 능력

어쩌면 누군가는 OCR 시스템을 사용했다. 이들 중 하나 - 파인 리더, RuNet 시스템에서 매우 인기가있다. 사용자가 데이터를 입력 여러 형태로, 그들은 완벽하게 스캔 정보가 아주 잘 시스템에 의해 인식되고있다. 그러나 사진에 텍스트와 상황은 더 나쁘다. 이 문제는 여전히 해결되지.

컴퓨터 비전과 관련된 게임, 모션 캡쳐

별도의 큰 영역 - 입체 모델과 (아주 성공적으로 컴퓨터 게임에 구현) 모션 캡처의 창조이다. 컴퓨터 비전을 사용하여 첫 번째 프로그램 - 컴퓨터의 동작을 사용하여 상호 작용하는 시스템. 이 생성 된 때 열려 많은 것들을했다.

알고리즘은 매우 간단하게 설계되어 있지만 만 사진을 얻기 위해 사람들의 합성 이미지의 발전기를 만드는 데 걸린 구성 할 수 있습니다. 그들과 함께 슈퍼 그가 지금은 잘 작동하는 알고리즘의 매개 변수를 선택합니다.

즉 만 개 이미지와 수 주 셀 수있는 슈퍼 컴퓨터 시간이 실시간으로 위치를 인식 할 수있는 사람을 하나 개의 프로세서의 용량의 12 %를 소비하고 있습니다 알고리즘을 만들 수 있습니다. 이 마이크로 소프트 키 넥트 시스템 (2010).

컨텐츠로 이미지 검색을 사용하면 시스템에 사진을 업로드 할 수 있고, 그것의 결과는 동일한 콘텐츠를 가진 모든 사진을주고 같은 각도로 만든 것입니다.

컴퓨터 비전의 예 : 3 차원과 2 차원지도는 지금 만들어지고있다. 네비게이션 자동차에 대한지도는 정기적으로 DVR에 따라 업데이트됩니다.

지오 태깅 사진의 수십억 데이터베이스가 있습니다. 데이터베이스에서 사진을 다운로드하면, 당신은 그것을 만든, 심지어 어떤 관점에서 위치를 판별 할 수 있습니다. 물론, 장소는 관광객 한 번 정도로 그 인기가 제공하고 지역의 사진의 숫자가되었습니다했다.

로봇은 어디에나있다

어떤 식 으로든없이 모든 곳에서 본 시간에 로봇. 이제 드라이버 (이 컴퓨터 프로그램이 볼 수있는 방법으로, 자동차 운전자를 도움)에 명령을 전송하는 보행자와 도로 표지판을 인식하는 특수 카메라가 차량이있다. 그리고 거기 완전 자동화 된 로봇 차량이지만, 그들은 추가로 많은 양의 정보를 사용하지 않고 비디오 카메라 시스템에만 의존 할 수 없다.

현대 카메라 - 이것은 아날로그 카메라 옵스큐라입니다

의 디지털 이미지에 대해 얘기하자. 현대 디지털 카메라는 카메라 옵스큐라의 원칙에 배치되어있다. 대신에서만 광이 입사 빔과 자기 회로의 상기 챔버의 상부 벽 상에 투영되는 구멍, 우리는 특별한 광학계 렌즈 불렀다. 그 목적은 큰 광속을 수집하고 모든 광선 투영을 얻고 필름 매트릭스에 화상을 형성하기 위해 가상 점을 통과하도록 변환한다.

현대의 디지털 카메라 (매트릭스)는 개별 요소로 구성된다 - 픽셀. 각 화소는 화소 전체에 입사되는 빛의 에너지를 측정하고, 하나의 출력 수를 실행할 수있다. 따라서, 디지털 카메라에서, 우리는 대신에 하나의 화소에 잡힌 이미지 밝기 세트 광 측정으로 얻을 - 컴퓨터 시야를. 따라서, 우리가 보는 이미지가 선과 명확한 윤곽, 그리고 다른 색상 색깔의 사각형의 격자 흐르는되지 않을 때 - 픽셀.

당신은 세계 최초의 디지털 이미지를 볼 수 아래.

그러나이 사진에 있지? 컬러. 색상은 무엇입니까?

색의 심리적 인식

색상 - 이것은 우리가 볼 것입니다. 인간과 고양이에 대한 하나의 색상과 같은 일이 다릅니다. 우리 (인간)과 동물의 광학 시스템 때문에 - 비전은 다르다. 따라서, 색상 - 그것은 물체와 빛을 관찰 할 때 발생 비전의 심리적 품질입니다. 그리고하지 물체와 빛의 물리적 속성입니다. 색상 - 빛 구성 요소의 상호 작용, 그리고 우리의 시각 시스템의 현장의 결과이다.

파이썬 사용하여 라이브러리의 프로그래밍 컴퓨터 비전

당신이 컴퓨터 비전의 연구에 진지하게 참여하기로 결정한 경우, 즉시 많은 어려움에 대비해야한다,이 과학은 가장 쉬운하지 않고 함정의 숫자를 숨 깁니다. 그러나 얀 에릭 솔레마의 저자 "파이썬에서 프로그래밍 컴퓨터 비전"- 모든 가장 간단한 언어를 설명 책. 다음은 3D로 다양한 개체의 인식의 방법에 익숙해 것, 스테레오 이미지, 가상 현실 및 컴퓨터 비전의 많은 다른 응용 프로그램과 작업을 배웁니다. 이 책에서는 파이썬에 충분한 예입니다. 그러나 설명은 너무 많은 연구와 하드 데이터를 과부하하지 않도록 때문에, 일반화, 말하자면,되게됩니다. 학생, 아마추어 및 애호가에 적합한 작업 할 수 있습니다. 컴퓨터 비전 (PDF 포맷)에 대한이 책 등을 다운로드 네트워크에있을 수 있습니다.

이 순간, 컴퓨터 비전 알고리즘 및 화상 처리 수치 알고리즘 OpenCV의 오픈 소스 라이브러리있다. 그것은 가장 현대적인 프로그래밍 언어에 구현 된 오픈 소스입니다. 우리는 컴퓨터 비전에 대해 이야기하면, 파이썬은 또한 라이브러리의 지원을하고, 프로그래밍 언어로 사용하고, 또한, 지속적으로 진화하고 좋은 커뮤니티가 있습니다.

이 회사는 "마이크로 소프트는"자사의 서비스 API-수있는 사람들의 이미지와 함께 작동하도록 신경 네트워크를 양성하기 위해 제공합니다. 컴퓨터 비전을 적용 할 수있는 기회도 있습니다, 파이썬 프로그래밍 언어로 사용합니다.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ko.delachieve.com. Theme powered by WordPress.