Recentemente, uma novidade chamou a atenção dos desenvolvedores de Android: a ML Kit GenAI Prompt API. Em sua versão alfa, essa ferramenta permite que os programadores façam requisições em linguagem natural e multimodal para o Gemini Nano, que opera diretamente no dispositivo. Isso abre um leque de possibilidades para a criação de funcionalidades inovadoras e personalizadas em aplicações móveis.

Introdução

A tecnologia avança a passos largos, e a integração da inteligência artificial em dispositivos móveis é um dos maiores desafios e oportunidades que temos hoje. A nova Prompt API do Android oferece uma maneira de interagir com modelos de IA usando não apenas texto, mas também imagens. Essa abordagem. pode transformar a forma como desenvolvemos aplicações, tornando-as mais intuitivas e responsivas às necessidades dos usuários.

O que a Prompt API traz de novo?

Antes, os desenvolvedores estavam limitados a APIs que ofereciam funcionalidades pré-definidas, como sumarização de textos ou descrição de imagens. Agora, com a Prompt API, temos a liberdade de criar prompts personalizados que podem guiar a IA a realizar tarefas específicas de acordo com as necessidades do nosso aplicativo. Isso significa que podemos ir além do básico, criando experiências únicas e adaptadas ao nosso público.

Funcionalidades e exemplos práticos

Essa nova API aceita tanto entradas de texto quanto combinações de imagem e texto, gerando respostas em texto. Imagine um aplicativo que permite que um usuário tire uma foto de um objeto e pergunte: "O que é isso?". Com a Prompt API, isso é possível! Aqui está um exemplo de como isso pode ser implementado:


Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Esse código mostra como é cimples integrar a API e começar a fazer requisições de forma personalizada. A flexibilidade é um dos maiores atrativos aqui, permitindo que cada desenvolvedor crie soluções que realmente atendam às demandas dos usuários.

Dicas avançadas para aproveitar ao máximo a Prompt API

Conclusão

Com a chegada da Prompt API, estamos diante de uma nova era de interações com a inteligência artificial nos dispositivos móveis. A liberdade de criar prompts personalizados não só enriquece a experiência do usuário, mas também desafia os desenvolvedores a pensar fora da caixa. É um momento empolgante, mas também exige responsabilidade, especialmente em relação à privacidade e ao desempenho dos dispositivos. Estou ansioso para ver como essa tecnologia será utilizada e as inovações que surgirão dela. O futuro parece promissor!