#AZURE – #VisionAPI, add a frame for each detected text #OCR

Hello

 

In the post yesterday I shared an example to show how to recognize text in pictures. The OCR API returns a collection of regions where the text is recognized.

If we go through each region can recognize points to create a frame, and inside it is the recognized text.

Clipboard02

If we put together the facial recognition with text, we have a collection of Frames to add the image with different recognized elements.

Clipboard02

Finally, an example with a meme and the great Ron Burgundy

Clipboard04

With the following results

Language: en
Orientation: Up
Text Angle: 0
Region

BoundingBox: 25,8,489,396
Rectangle:
Left 25, Top 8,
Height 396, Width 489

Lines
I’M NOT ANTI-SOCIAL
I’M SELECTIVELY SOCIAL
THERE’S A DIFFERENCE.

The source code is avilable in GitHub https://github.com/elbruno/ProjectOxford

Greetings @ Madrid !

El Bruno

References

Advertisements

#AZURE – #VisionAPI, agregando marcos en cada text detectado

Hola

En el post de ayer compartí un ejemplo para mostrar como reconocer texto en imágenes. La API de OCR retorna una colección de regiones donde se reconoce el texto.

Si recorremos cada región podemos reconocer los puntos para crear un frame, y dentro del mismo está el texto reconocido.

Clipboard02

Si juntamos el reconocimiento facial con el de texto, tenemos una colección de Frames para agregar en la imagen, con diferentes elementos reconocidos.

Clipboard02

Finalmente, un ejemplo con un meme y el gran Ron Burgundy

Clipboard04

Con los siguientes resultados

Language: en
Orientation: Up
Text Angle: 0
Region

BoundingBox: 25,8,489,396
Rectangle:
Left 25, Top 8,
Height 396, Width 489

Lines
I’M NOT ANTI-SOCIAL
I’M SELECTIVELY SOCIAL
THERE’S A DIFFERENCE.

 El código fuente esta disponible en GitHub https://github.com/elbruno/ProjectOxford

Saludos @ Madrid !

El Bruno

References

#AZURE – #VisionAPI and optical character recognition #OCR

Hello

The API VisionAPI in Project Oxford also gives us the ability to perform optical character recognition in an image. What we usually known as OCR.

The result of the OCR process, shows us information with

  • the language of the detected language
  • the area where the text has been detected
  • the angle of the text
  • a collection of lines within each area of detected text
  • a collection of words per line

So a McDonalds sign returns the following information

01

Language: en
Orientation: Up
Text Angle: 5.89999999999997
Region

Rectangle:
Left 75, Top 74,
Height 132, Width 210

Lines
please do not
eat the
billboard
all white meat chicken

The About Windows form returns

Clipboard01

Language: en
Orientation: Up
Text Angle: 0
Region

Rectangle:
Left 9, Top 11,
Height 311, Width 402

Lines
About Windows
Windows 10
Microso ft Mndows
Version 1511 (osBui1d 10586.11)
@ 2015 Microsoft Corporaton. Al rights reserved.
The Windows 10 Enterprise operating system and its user interface are
protected by trademark and other pending or existing intellectual property
rights in the United States and other countries/regions.
This product is licensed under the Microsoft Software License
Terms to:
brunocapuano@msn.com

And a live action demo is like this one where PADDINGTON is quickly added into the image information

2015 11 24 Vision Api ocr

 

The source code is avilable in GitHub https://github.com/elbruno/ProjectOxford

Greetings @ Madrid !

El Bruno

References

#AZURE – #VisionAPI y reconocimiento de texto

Hola

 La API VisionAPI de Project Oxford también nos brinda la capacidad de realizar reconocimiento óptico de caracteres en una imagen. Lo que popularmente conocemos como OCR.

El resultado del proceso de OCR, nos muestra información con

  • el idioma del lenguaje detectado
  • la zona donde se ha detectado el texto
  • el ángulo de inclinación del texto
  • una colección de líneas dentro de cada zona de texto detectado
  • una colección de palabras por cada línea

Asi un letrero de McDonalds devuelve la siguiente información

01

Language: en
Orientation: Up
Text Angle: 5.89999999999997
Region

Rectangle:
Left 75, Top 74,
Height 132, Width 210

Lines
please do not
eat the
billboard
all white meat chicken

Y la ventana de información de versión de Windows retorna

Clipboard01

Language: en
Orientation: Up
Text Angle: 0
Region

Rectangle:
Left 9, Top 11,
Height 311, Width 402

Lines
About Windows
Windows 10
Microso ft Mndows
Version 1511 (osBui1d 10586.11)
@ 2015 Microsoft Corporaton. Al rights reserved.
The Windows 10 Enterprise operating system and its user interface are
protected by trademark and other pending or existing intellectual property
rights in the United States and other countries/regions.
This product is licensed under the Microsoft Software License
Terms to:
brunocapuano@msn.com

Como siempre mejor verlo en acción

2015 11 24 Vision Api ocr

El código fuente esta disponible en GitHub https://github.com/elbruno/ProjectOxford

Saludos @ Madrid !

El Bruno

References

#AZURE – #VisionAPI implementation for image analysis

Hola

I previous posts I wrote about one of the Project Oxford features > VisionAPI .

Using the API you can analize and get different properties of an image. For example:

  • Image type: JPG, PNG, TIF, etc.
  • Image size
  • Type of image, clipart, line drawing, etc.
  • Sex-Rate score
  • Categories, which examines details such as “photo on the beach”, “sports field”, “mountain”. For each category is defined a value between 0 and 1, with the Score for that category
  • Dominant colors in the image
  • Result of face detection. It uses FaceAPI to the face detection and analysis of the age and sex of each

For example, if we carry out analysis in the classic background of Windows XP we have this result

windows-xp-sc 120

Image Format : Jpeg – Image Dimensions : 1280 x 800
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.00597422197461128)
Is Racy Content : False – Racy (0.0093834400177002)
Categories :
Name : outdoor_grass (0.60546875)
AccentColor : 1349B8
Dominant Color Background : Blue
Dominant Color Foreground : Green
Dominant Colors :  Blue, Green

An old picture of Valentino in the beach return this value as main category: outdoor_oceanbeach

01 120

Image Format : Jpeg – Image Dimensions : 2048 x 1365
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.0140524050220847)
Is Racy Content : False – Racy (0.0120803946629167)
Categories :
Name : outdoor_oceanbeach (0.90625)
AccentColor : 765F49
Dominant Color Background : Grey
Dominant Color Foreground : Grey
Dominant Colors :  Grey, White

And my cat “Anakin” is also recognized as a “cat”

02 120

Image Format : Jpeg – Image Dimensions : 478 x 478
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.024529742076993)
Is Racy Content : False – Racy (0.10783302038908)
Categories :
Name : animal_cat (Score : 0.9921875)
AccentColor : C78C04
Dominant Color Background : Brown
Dominant Color Foreground : Brown
Dominant Colors : Brown

The source code is avilable in GitHub https://github.com/elbruno/ProjectOxford

Greetings @ Madrid !

El Bruno

References

#AZURE – Implementación de #VisionAPI para analizar imágenes

Hola

En el post anterior mostré un ejemplo funciona sobre las capacidades que presenta VisionAPI de Project Oxford.

Utilizando la API podemos ver diferentes características de una imagen. Por ejemplo:

  • Tipo de imagen: JPG, PNG, TIF, etc.
  • Tamaño de la imagen
  • Tipo de imagen, clipart, dibujo lineal, etc
  • Evaluación de si es contenido para mayores
  • Categorías, donde se analizan detalles como “foto en la playa”, “campo deportivo”, “montaña”. Para cada categoría se define un valor entre 0 y 1, con el Score para esa categoría
  • Colores dominantes en la imagen
  • Resultado de detección de rostros. En este punto, utiliza FaceAPI para la detección de rostros y análisis de edad y sexo de cada uno

Por ejemplo, si realizamos el análisis en el clásico fondo de Windows XP tendremos este resultado

windows-xp-sc 120

Image Format : Jpeg – Image Dimensions : 1280 x 800
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.00597422197461128)
Is Racy Content : False – Racy (0.0093834400177002)
Categories :
Name : outdoor_grass (0.60546875)
AccentColor : 1349B8
Dominant Color Background : Blue
Dominant Color Foreground : Green
Dominant Colors :  Blue, Green

Esta foto de hace unos años nos retorna en categorías: outdoor_oceanbeach

01 120

Image Format : Jpeg – Image Dimensions : 2048 x 1365
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.0140524050220847)
Is Racy Content : False – Racy (0.0120803946629167)
Categories :
Name : outdoor_oceanbeach (0.90625)
AccentColor : 765F49
Dominant Color Background : Grey
Dominant Color Foreground : Grey
Dominant Colors :  Grey, White

Y en una del gatito Anakin, podemos ver como detecta que es una foto de un gatito

02 120

Image Format : Jpeg – Image Dimensions : 478 x 478
Clip Art Type : 0 Non-clipart
Line Drawing Type : 0 Non-LineDrawing
Is Adult Content : False – Adult (0.024529742076993)
Is Racy Content : False – Racy (0.10783302038908)
Categories :
Name : animal_cat (Score : 0.9921875)
AccentColor : C78C04
Dominant Color Background : Brown
Dominant Color Foreground : Brown
Dominant Colors : Brown

El código fuente esta disponible en GitHub https://github.com/elbruno/ProjectOxford

Saludos @ Madrid !

El Bruno

References

#AZURE – Utilizando #VisionAPI en nuestras aplicaciones

Hola

Después de ver los ejemplos de Face API para detección de rostros y Emotion APIs para detección de emociones, hoy es el momento de realizar un repaso por las capacidades que nos brinda Vision API.

Este servicio permite analizar imágenes y el resultado de este análisis nos muestra información como la categorías asociadas a la imagen, detección de pornográfica, colores dominantes, etc.

Por ejemplo, la siguiente imagen es un collage con imágenes de la copa del mundo de rugby de Londres de hace un mes. Además del análisis de rostros y emociones, en la 3ra columna, mostramos la información del resultado del análisis con Vision API.

Clipboard01

En la misma podemos ver que la categoría detectada es outdoor, y que además también ha detectado los rostros.

Categories :
Name : outdoor_sportsfield; Score : 0.7890625
Faces :
Age : 17; Gender : Female
Age : 41; Gender : Male
Age : 10; Gender : Female
Age : 6; Gender : Female

En el caso de una imagen mía en un Ford Mustang, nuevamente se detectan rostros, emociones, y la categoría de coches.

Clipboard03

En próximos posts comentaré el detalle de la utilización de esta API, sin embargo un detalle interesante es que ya tenemos algunos paquetes NuGet para trabajar con estas APIs. Todavía no son PCLs, asi que solo los podremos utilizar en projectos Desktop, aunque con 10 minutos de trabajo puedes create tu implementación PCL de las mismas.

Clipboard05

Un ejemplo analizando paisajes y personas se puede ver en el siguiente video

2015 11 19 Oxfordd Vision

El código fuente esta disponible en GitHub https://github.com/elbruno/ProjectOxford

Saludos @ Madrid !

El Bruno

References