Google Lookout sử dụng AI để giúp người khiếm thị

Tính năng ‘Image Q&A’ của Google Lookout sử dụng mô hình mô tả hình ảnh tiên tiến được phát triển bởi Google DeepMind. Tính năng này được phát triển để cho ra những đoạn văn mô tả chi tiết hình ảnh, với hy vọng có thể giúp cho người khiếm thị.

Cách Google Lookout hoạt động
Hiện tính năng này có ở Mỹ, Anh, Canada

Google cho biết tính năng ‘Image Q&A’ của Lookout cho phép người khiếm thị nắm bắt được thông tin của các hình ảnh trên mạng xã hội hoặc trong cuộc hội thoại nhóm. Công nghệ AI này được phát triển bởi Google DeepMind (là phòng thí nghiệm nghiên cứu trí tuệ nhân tạo con của Google).

Người dùng cũng có thể tải lên một hình ảnh và nhận được bản miêu tả về bức ảnh ngay cả khi nó không có phụ đề hoặc văn bản thay thế. Sau khi Lookout cung cấp mô tả về bức ảnh, người dùng có thể đặt thêm câu hỏi bằng cách gõ hoặc sử dụng giọng nói.

Nếu bạn không biết, ‘Alt text’ mô tả nội dung của hình ảnh và có thể được sử dụng bởi các trình đọc ảnh để giúp người có vấn đề về thị lực hiểu về hình ảnh họ đang xem. Nhưng vấn đề là các hình ảnh được chia sẻ trên ứng dụng nhắn tin hoặc mạng xã hội thường có phụ đề và văn bản thay thế không chính xác, có khi hầu hết chúng còn không có ‘Alt text’. Điều này làm cho hầu hết các hình ảnh trên mạng không thể tiếp cận được đối với người có vấn đề về thị lực.

Hiện tại, tính năng Image Q&A chỉ có ở Hoa Kỳ, Vương quốc Anh và Canada, nhưng Google cho biết nó sẽ sớm có trên toàn thế giới. Lookout cũng đã hỗ trợ cho 11 ngôn ngữ mới như tiếng Hàn, tiếng Nhật và tiếng Trung, nâng tổng số ngôn ngữ hỗ trợ lên 34.

Trong những năm gần đây, Google đã đưa ra nhiều cải thiện accessibility cho người dùng. Dự án Relate của công ty có mục đích giúp đỡ những người có vấn đề về khả năng giao tiếp. Ví dụ như tính năng Live Transcribe sẽ chuyển đổi từ lời nói sang văn bản cho những người có vấn đề về thính giác. Apple cũng đã đưa ra một số tính năng hữu ích như ‘People Detection’, cho phép người có thị lực kém biết được người khác cách xa họ bao nhiêu. Ngoài ra Apple cũng hộ trợ tính năng Live Captions (phụ đề trực tiếp) trên FaceTime.

Xem thêm: Cư dân mạng “rần rần” với tính năng Emoji Kitchen mới của Google

Khám phá thêm
Temu, một ứng dụng mua sắm Trung Quốc, đang gây chấn động trên internet với những sản phẩm rất rẻ....
Trong bài viết này, Techie sẽ giới thiệu đến bạn bản chất của tính năng constraints và auto-layout figma, cũng...
“Chúng ta đang sống trong thế giới VUCA” – Câu nói này đã diễn tả đúng tình trạng thế giới...
Theo một “nguồn tin mật” cho hay, Ghibli chính thức công bố trailer phần tiếp theo của tựa phim Vùng...
Thuật toán Dijkstra là một công cụ quan trọng trong lý thuyết đồ thị và tối ưu hóa. Với khả...
Nếu như các ứng dụng hẹn hò như Tinder, Okcupid, Facebook Dating vẫn chưa đem đến cho bạn một anh...
Công cụ AI (trí tuệ nhân tạo) là một phần mềm hoặc hệ thống được phát triển dựa trên các...
Với tỷ lệ dân số sử dụng Internet chiếm đến hơn 70%, Việt Nam luôn được coi là thị trường...