Afinal, o que significa ‘IA de código aberto’?

Angelica Vergas June 22, 2024

0 7 minutes read

Afinal, o que significa ‘IA de código aberto’?

O luta entre software de código aberto e software proprietário é bem compreendido. Mas as tensões que permeiam os círculos de software há décadas embaralharam no crescente espaço da inteligência artificial, com controvérsia em sua perseguição.

O New York Times recentemente publicou uma avaliação entusiasmada do CEO da Meta, Mark Zuckerberg, observando como sua adoção de “IA de código aberto” o tornou popular mais uma vez no Vale do Silício. O problema, porém, é que o Meta Marca Lhama grandes modelos de linguagem não são realmente de código aberto.

Ou são eles?

Pela maioria das estimativas, eles não são. Mas destaca como a noção de “IA de código aberto” só irá suscitar mais debates nos próximos anos. Isso é algo que a Open Source Initiative (OSI) está tentando resolver, liderado pelo diretor executivo Stefano Maffulli (foto acima), que trabalha no problema há mais de dois anos através de um esforço global que abrange conferências, workshops, painéis, webinars, relatórios e muito mais.

IA não é código de software

Créditos da imagem: Westend61 via Getty

O OSI tem sido um administrador do Definição de código aberto (OSD) há mais de um quarto de século, estabelecendo como o termo “código aberto” pode, ou deve, ser aplicado ao software. Uma licença que atenda a esta definição pode ser legitimamente considerada “código aberto”, embora reconheça um espectro de licenças variando de extremamente permissivo a não tão permissivo.

Mas transpor convenções legadas de licenciamento e nomenclatura de software para IA é problemática. José Jacksevangelista de código aberto e fundador da empresa VC Capital OSSchega a dizer que existe “não existe IA de código aberto”, observando que “o código aberto foi inventado explicitamente para o código-fonte do software”.

Em contraste, “rede neural pesos” (NNWs) – um termo usado no mundo da inteligência artificial para descrever os parâmetros ou coeficientes através dos quais a rede aprende durante o processo de treinamento – não são de forma significativa comparáveis ao software.

“Os pesos líquidos neurais não são código-fonte de software; eles são ilegíveis por humanos, nem depuráveis”, observa Jacks. “Além disso, os direitos fundamentais do código aberto também não se traduzem nos NNWs de forma congruente.”

Isso levou Jacks e colega da OSS Capital Heather Meeker para criar sua própria definição de espécieem torno do conceito de “pesos abertos”.

Portanto, antes mesmo de chegarmos a uma definição significativa de “IA de código aberto”, já podemos ver algumas das tensões inerentes à tentativa de chegar lá. Como podemos chegar a acordo sobre uma definição se não podemos concordar que a “coisa” que estamos definindo existe?

Maffulli, pelo que vale, concorda.

“A questão está correta”, disse ele ao TechCrunch. “Um dos debates iniciais que tivemos foi se deveríamos chamá-la de IA de código aberto, mas todo mundo já estava usando o termo.”

Isto reflete alguns dos desafios na esfera mais ampla da IA, onde abundam os debates sobre se aquilo que hoje chamamos de “IA” realmente é IA ou apenas sistemas poderosos ensinados a detectar padrões entre vastas áreas de dados. Mas os pessimistas estão, em sua maioria, conformados com o fato de que a nomenclatura “IA” está aqui, e não faz sentido combatê-la.

Ilustra??o de lhama — **Créditos da imagem:** Larysa Amosova via Getty

Fundada em 1998, a OSI é uma corporação de utilidade pública sem fins lucrativos que trabalha em uma infinidade de atividades relacionadas ao código aberto em torno de defesa de direitos, educação e sua principal razão de ser: a definição de código aberto. Hoje, a organização depende de patrocínios para financiamento, com membros conceituados como Amazon, Google, Microsoft, Cisco, Intel, Salesforce e Meta.

O envolvimento da Meta com o OSI é particularmente notável neste momento no que se refere à noção de “IA de código aberto”. Apesar do Meta pendurar seu chapéu de IA no peg de código abertoa empresa tem restrições notáveis em relação a como seus modelos Llama podem ser usados: claro, eles podem ser usados gratuitamente para pesquisa e casos de uso comercial, mas os desenvolvedores de aplicativos com mais de 700 milhões de usuários mensais devem solicitar uma licença especial da Meta, que ele concederá puramente a seu próprio critério.

Simplificando, os irmãos Big Tech da Meta podem assobiar se quiserem.

A linguagem da Meta em torno de seus LLMs é um tanto maleável. Embora a empresa tenha chamado seu Modelo Llama 2 de código abertocom o chegada da Lhama 3 em Abril, afastou-se um pouco da terminologia, usando frases como “disponível abertamente” e “acessível abertamente”. Mas em alguns lugares, é ainda se refere o modelo como “código aberto”.

“Todos os outros envolvidos na conversa concordam perfeitamente que o próprio Llama não pode ser considerado código aberto”, disse Maffulli. “As pessoas com quem conversei e que trabalham na Meta sabem que é um pouco exagerado.”

Além disso, alguns podem argumentar que há um conflito de interesses aqui: uma empresa que demonstrou o desejo de aproveitar a marca do código aberto também fornece financiamento aos administradores da “definição”?

Esta é uma das razões pelas quais o OSI está a tentar diversificar o seu financiamento, garantindo recentemente uma subvenção do Fundação Sloan, que está ajudando a financiar seu esforço global multilateral para alcançar a definição de IA de código aberto. O TechCrunch pode revelar que esse subsídio equivale a cerca de US$ 250.000, e Maffulli está esperançoso de que isso possa alterar a ótica em torno de sua dependência de financiamento corporativo.

“Essa é uma das coisas que a doação do Sloan deixa ainda mais clara: poderíamos dizer adeus ao dinheiro da Meta a qualquer momento”, disse Maffulli. “Poderíamos fazer isso antes mesmo deste Sloan Grant, porque sei que receberemos doações de outras pessoas. E Meta sabe disso muito bem. Eles não estão interferindo em nada disso [process]nem a Microsoft, nem o GitHub, nem a Amazon, nem o Google — eles sabem absolutamente que não podem interferir, porque a estrutura da organização não permite isso.”

Definição funcional de IA de código aberto

Ilustração conceitual representando como encontrar uma definição — **Créditos da imagem:** Aleksei Morozov/Getty Images

O rascunho atual da definição de IA de código aberto está em versão 0.0.8, constituindo três partes principais: o “preâmbulo”, que define a missão do documento; a própria definição de IA de código aberto; e uma lista de verificação que percorre os componentes necessários para um sistema de IA compatível com código aberto.

De acordo com o rascunho atual, um sistema de IA de código aberto deve conceder liberdade para usar o sistema para qualquer finalidade sem solicitar permissão; permitir que outros estudem como o sistema funciona e inspecionem os seus componentes; e modificar e compartilhar o sistema para qualquer finalidade.

Mas um dos maiores desafios tem sido em torno dos dados – isto é, um sistema de IA pode ser classificado como “código aberto” se a empresa não disponibilizou o conjunto de dados de treinamento para que outros possam consultá-lo? Segundo Maffulli, é mais importante saber de onde vieram os dados e como um desenvolvedor rotulou, desduplicou e filtrou os dados. E também, ter acesso ao código que foi utilizado para montar o conjunto de dados a partir de suas diversas fontes.

“É muito melhor conhecer essas informações do que ter o conjunto de dados simples, sem o resto”, disse Maffulli.

Embora fosse bom ter acesso ao conjunto de dados completo (o OSI torna este um componente “opcional”), Maffulli diz que não é possível ou prático em muitos casos. Isso pode ocorrer porque há informações confidenciais ou protegidas por direitos autorais contidas no conjunto de dados que o desenvolvedor não tem permissão para redistribuir. Além disso, existem técnicas para treinar modelos de aprendizagem automática em que os dados em si não são realmente partilhados com o sistema, utilizando técnicas como aprendizagem federada, privacidade diferencial e encriptação homomórfica.

E isso destaca perfeitamente as diferenças fundamentais entre “software de código aberto” e “IA de código aberto”: as intenções podem ser semelhantes, mas não são comparáveis, e essa disparidade é o que o OSI está tentando capturar em seu definição.

No software, o código-fonte e o código binário são duas visões do mesmo artefato: eles refletem o mesmo programa em formas diferentes. Mas o treinamento de conjuntos de dados e os modelos treinados subsequentes são coisas distintas: você pode usar o mesmo conjunto de dados e não será necessariamente capaz de recriar o mesmo modelo de forma consistente.

“Há uma variedade de lógicas estatísticas e aleatórias que acontecem durante o treinamento, o que significa que ele não pode torná-lo replicável da mesma forma que o software”, acrescentou Maffulli.

Portanto, um sistema de IA de código aberto deve ser fácil de replicar, com instruções claras. E é aqui que entra em jogo a faceta da lista de verificação da definição de IA de código aberto, que se baseia em um artigo acadêmico publicado recentemente chamado “A Estrutura de Abertura do Modelo: Promovendo Integralidade e Abertura para Reprodutibilidade, Transparência e Usabilidade em Inteligência Artificial”.

Este artigo propõe o Model Openness Framework (MOF), um sistema de classificação que classifica modelos de aprendizado de máquina “com base em sua integridade e abertura”. O MF exige que componentes específicos do desenvolvimento do modelo de IA sejam “incluídos e lançados sob licenças abertas apropriadas”, incluindo metodologias de formação e detalhes sobre os parâmetros do modelo.

Condição estável

Stefano Maffulli apresentando-se na cimeira dos membros da Digital Public Goods Alliance (DPGA) em Adis Abeba.

A OSI está chamando o lançamento oficial da definição de “versão estável”, assim como uma empresa fará com um aplicativo que passou por extensos testes e depuração antes do horário nobre. O OSI propositalmente não o chama de “versão final” porque partes dele provavelmente evoluirão.

“Não podemos realmente esperar que esta definição dure 26 anos como a definição de código aberto”, disse Maffulli. “Não espero a parte superior da definição – como ‘o que é um sistema de IA?’ – mudar muito. Mas as peças a que nos referimos no checklist, essas listas de componentes dependem de tecnologia? Amanhã, quem sabe como será a tecnologia.”

Espera-se que a definição estável de IA de código aberto seja carimbada pelo Conselho no Conferência Todas as Coisas Abertas no final de outubro, com o OSI embarcando em um roadshow global nos meses seguintes, abrangendo cinco continentes, buscando mais “contribuições diversas” sobre como a “IA de código aberto” será definida no futuro. Mas quaisquer alterações finais provavelmente serão pouco mais do que “pequenos ajustes” aqui e ali.

“Esta é a reta final”, disse Maffulli. “Chegamos a uma versão completa da definição; temos todos os elementos que precisamos. Agora temos uma lista de verificação, por isso estamos verificando se não há surpresas nela; não há sistemas que devam ser incluídos ou excluídos.”

Source

Angelica Vergas June 22, 2024

0 7 minutes read