Rompendo barreiras: porque a integração entre startups e academia é necessária
O número de professores que se lançam como empreendedores é pequeno, fazendo com que muitas pesquisas de laboratórios acadêmicos fiquem perdidas.
Buscar a integração com a comunidade acadêmica tem se mostrado um caminho natural a ser percorrido pelo time da Nama. Acreditamos que intensificar o diálogo entre mercado, universidade e pesquisadores é preparar e fortalecer o cenário e a sociedade para a recorrente evolução tecnológica.
Isso ficou claro durante o Latin America Research Awards (LARA), um programa de incentivo financeiro do Google aos pesquisadores latino-americanos da área de Ciência da Computação. Com esse projeto, a empresa de tecnologia se compromete a distribuir cerca de 2 milhões de reais, ao longo de doze meses, entre os selecionados para que avancem em seus estudos.
A última edição do LARA aconteceu numa quinta-feira de agosto (24), no Campus São Paulo, e a Nama esteve por lá no painel “How to bring academia closer to the startup ecosystem” [Como aproximar a academia de startups, em tradução], com a participação do CEO Rodrigo Scotti.
Mais do que vencedores, o LARA apresentou importantes insights.
Para começar, foi notório o mérito dos pesquisadores brasileiros. O Google selecionou 27 projetos científicos, dentre as 281 submissões recebidas de nove países da América Latina. Os cientistas do Brasil lideraram o ranking, com o maior número de trabalhos selecionados — foram 10 no total. Outro ponto interessante: machine learning (ou aprendizado de máquina) foi disparado o tópico mais abordado — 14 dos 27 projetos escolhidos tocaram no tema.
Para quem ainda não está familiarizado com o termo, nesse método as aplicações são programadas para aprender e reconhecer padrões em dados. Ou seja, se você ainda acha que a Netflix te conhece tão bem por algum mistério cósmico, não se iluda mais! O serviço de streaming não faz à toa sugestões tão certeiras de filmes ou seriados. Por trás, há todo um sistema de machine learning que, com base em outros conteúdos assistidos e avaliados por você, é capaz de fazer boas indicações.
Você pode aprender mais sobre o assunto no vídeo abaixo [em inglês].
Machine learning, inclusive, nos leva ao terceiro ponto dessa reflexão.
Há muitas pesquisas dentro dos laboratórios acadêmicos que estão em sintonia com o que vem sendo trabalhado no mercado — e vice-versa. Mas, em entrevista recente ao portal VEJA.com, o diretor de engenharia do Google, Berthier Ribeiro-Neto, destacou que o número de professores que estão se lançando como empreendedores ainda é pequeno, assim como o número de empreendedores que vão à universidade em busca de uma expertise.
O diretor de engenharia, que é ex-professor universitário, também observa que, no caso da universidade, se a tecnologia fica dentro dos muros do campus universitário, o destino mais provável dela é o esquecimento.
“E vemos isso acontecendo com bastante frequência. O professor universitário tem a ideia, mas precisa se lançar na confecção de um protótipo para materializá-la, concretizá-la, torná-la clara e observável. Uma vez que se tem esse protótipo, é preciso dar o passo seguinte, que é mover essa tecnologia para além dos muros da universidade.”
Berthier Ribeiro-Neto, em entrevista
Abrir um diálogo entre empreendedores de tecnologia, universidades e pesquisadores é unir a rotina prática do mercado às discussões da academia, o que é benéfico para o avanço de novos estudos e para a evolução científica.
Num trabalho em conjunto, os pesquisadores científicos poderiam se beneficiar do pensamento inovador e do senso de urgência à prática, natural de muito empreendedor que possui facilidade para transformar conhecimento em produto comercial.
Já o empreendedor, poderia usufruir da infraestrutura da academia e da capacidade analítica e intelectual do pesquisador.
Tópicos em sintonia
Para mostrar que é possível a interação entre universidades e empresas, elencamos algumas pesquisas universitárias que estão em sintonia com nossa gama de conhecimentos e com os trabalhos que vêm sendo desenvolvidos por aqui.
A pesquisa “Optimizing Ensembles of Boosted Additive Bagged Trees for Learning-to-Rank”, de Marcos André Gonçalves (orientador) e Clebson C. A. de Sáufmg (orientando), da Universidade Federal de Minas Gerais (UFMG), é um desses destaques.
O foco do trabalho deles é resolver problemas de information retrieval, ou recuperação de informação, e é interessante pois pode ter aplicações práticas em “classificação” de pesquisa.
Talvez o termo não soe conhecido à primeira vista, mas se você utiliza um buscador quando precisa encontrar uma solução/informação para um problema, então information retrieval está presente na sua rotina.
Quando você faz uma busca no Google (ou outro buscador) e digita uma palavra-chave, a plataforma destrincha aquele termo em seu banco de dados para entregar o documento relacionado àquela consulta.
Com o estudo, Marcos e Clebson buscam otimizar uma lista ordenada por meio de documentos já definidos como relevantes por especialistas. Tudo isso usando o processo “Learning-to-Rank” combinado a técnicas bem-sucedidas de machine learning, como boosting e bagging, que são exemplos de ensemble learning.
Aliás, ensemble learning refere-se ao agrupamento de “técnicas de machine learning” (que também podem ser chamadas de “estimadores”) para chegar a uma previsão final que seja, possivelmente, mais segura.
Pode ser que você já tenha ouvido falar de ensemble learning por causa de random forest, método que combina diferentes árvores de decisão para chegar a um veredito final. As árvores de decisão são como “diagramas de fluxo” implementados para extrair a maior quantidade possível de informação de um certo conjunto de dados.
Para ter uma ideia da reputação dessa metodologia, em outubro de 2006 a Netflix lançou uma competição chamada Netflix Prize. Nesse concurso, a companhia de streaming oferecia um prêmio de um milhão de dólares a quem conseguisse melhorar o sistema que ela empregava naquele momento. Já é um fato consumado na história do machine learning que o concurso foi vencido, entre todos os algoritmos propostos, por um exemplo de ensemble learning.
“Temos aqui dois campos relevantes e interessantes: Machine Learning, que é a classificação de pontos de dados não conhecidos ou o descobrimento de padrões, e information retrieval, que é a procura de informação em um conjunto de dados. O problema de ranking é no ordenamento dos resultados de pesquisa para que o usuário possa ver os resultados mais relevantes — por exemplo, o Google. A interface entre machine learning e information retrieval será cada vez mais importante nos próximos anos como um jeito de adaptar a nova geração de linguagem e entender as tecnologias em menores conjuntos de dados.”
Bennett Bullock, diretor de Inteligência Artificial da Nama
Outro trabalho de destaque elencado é “Discussion-Based Entity Representation”, de Pedro Olmo Stancioli Vaz de Melo (orientador) e Túlio Corrêa Loures (orientando), também da UFMG, sobre sumarização. Esse estudo é muito útil para questões de perguntas e respostas.
O objetivo da dupla é desenvolver um método para extrair informações relevantes dos comentários de discussões feitas online, em blogs, fóruns e vídeos do YouTube, gerando resumos. Também inclui a criação de uma ferramenta que poderia gerar um sumário sobre comentários do mesmo tópico e agrupá-los com outros assuntos relacionados.
A pesquisa de Pedro e Túlio nos leva a mais um estudo acadêmico, que é a tese de doutorado do jornalista Lucas Araújo, da Universidade Metodista de São Paulo, sobre a ética jornalística na produção de notícias por máquinas.
Recentemente, Lucas publicou o artigo científico intitulado “News production by machines and ethics: possible implications”. Nele, o pesquisador defende que a ética é indispensável na relação homem-máquina, em especial na produção de notícias.
Além disso, Lucas acredita que existem situações nas quais as máquinas não poderão tomar decisões sozinhas sob o risco de cometerem erros. Por isso, segundo o pesquisador, é preciso avaliar as potencialidades e as limitações das máquinas para saber como lidar com os dilemas éticos jornalísticos.
Interação vem para somar
Muitas pesquisas que surgiram dentro de laboratórios e núcleos universitários resultaram não apenas em novos procedimentos e técnicas, mas também em plataformas decisivas para a evolução tecnológica. Buscapé e Kekanto, por exemplo, são ferramentas que nasceram em ambientes acadêmicos e escalaram seus muros para entrar no mercado e oferecer algo relevante à população.
Ter pensamento empreendedor é imprescindível para que uma pesquisa saia do campo das ideias e se torne palpável. Muitas outras iniciativas da academia têm potencial para ganhar dimensão no mercado, desde que o pesquisador pense além do ambiente universitário. Mas, para despertar essa mentalidade, é importante que haja aproximação das duas pontas (mercado e academia). Daí que entra a importância da interação entre pesquisadores e startups.
Afinal, ser visionário é uma característica bem a cara de startups. E, dessa forma, a experiência de startups já reconhecidas no mercado pode servir de parâmetro para despertar a veia mercadológica que falta nos pesquisadores.