Close Menu
  • Home
  • 24Hours News
  • Ai
  • Backlinks
  • Gadgets
  • Porto
  • Matosinhos
  • Tech

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

What's Hot

Matosinhos acende as luzes de Natal esta sexta-feira

November 25, 2025

Governo propõe aumentar vagas no Ensino Superior

November 25, 2025

Caminhões deixam de pagar pedágio no CREP em 2026

November 25, 2025
Facebook X (Twitter) Instagram
  • Home
  • About Matosinhos24h.com
  • Advertise with Us
  • Contact us
  • DMCA Policy
  • Policy
  • Terms of Use
Facebook X (Twitter) Instagram
MatoSinhos24hMatoSinhos24h
  • Home
  • 24Hours News
  • Ai
  • Backlinks
  • Gadgets
  • Porto
  • Matosinhos
  • Tech
MatoSinhos24hMatoSinhos24h
Home » Hugging Face lança benchmarks para testar IA generativa em tarefas de saúde
Ai

Hugging Face lança benchmarks para testar IA generativa em tarefas de saúde

FranciscoBy FranciscoApril 18, 2024No Comments4 Mins Read
Facebook Twitter Pinterest LinkedIn Tumblr Email
Share
Facebook Twitter LinkedIn Pinterest Email


Close da mão de um robô segurando um estetoscópio.automação de saúde

Créditos da imagem: Andrei Popov/Getty Images

Como escrevemos recentemente, os modelos generativos de IA estão a ser cada vez mais introduzidos em ambientes de saúde e, em alguns casos, talvez prematuramente. Os primeiros usuários acreditam que podem desbloquear insights que, de outra forma, seriam perdidos e, ao mesmo tempo, obter maior eficiência. No entanto, os críticos dizem que estes modelos são falhos e tendenciosos e podem levar a piores resultados de saúde.

Mas existe uma maneira de saber quantitativamente o quão útil ou prejudicial um modelo é quando encarregado de uma tarefa como resumir registros de pacientes ou responder a perguntas relacionadas à saúde?

A startup de IA Hugging Face propõe uma solução em um teste de benchmark recém-lançado chamado Open Medical-LLM. Criado em colaboração com pesquisadores da organização sem fins lucrativos Open Life Science AI e do Grupo de Processamento de Linguagem Natural da Universidade de Edimburgo, o Open Medical-LLM visa padronizar a avaliação de desempenho de modelos generativos de IA em uma variedade de tarefas relacionadas à saúde.

Open Medical-LLM é Do começo Embora seja uma referência em si, é antes uma concatenação de conjuntos de testes existentes (MedQA, PubMedQA, MedMCQA, etc.) que incorpora conhecimentos médicos gerais e áreas relacionadas, como anatomia, farmacologia, genética e prática clínica. modelos. Este benchmark inclui questões abertas e de múltipla escolha que exigem raciocínio e compreensão médica, extraídas de fontes como os exames de licenciamento médico dos EUA e da Índia e os bancos de perguntas para exames de biologia universitária contidos.

“[Open Medical-LLM] Isso permitirá que pesquisadores e profissionais de saúde identifiquem os pontos fortes e fracos de diferentes abordagens, impulsionem mais progressos na área e, em última análise, contribuam para melhores cuidados e resultados aos pacientes.”・O Sr. Faith escreveu em uma postagem no blog.

Geração de saúde com IA

Créditos da imagem: abraço cara

Hug Face descreve o benchmark como uma “avaliação robusta” de modelos generativos de IA na área da saúde. No entanto, alguns especialistas médicos alertaram nas redes sociais que investir demasiadas ações no Open Medical-LLM poderia levar a uma implementação mal informada.

Em relação a X, Liam McCoy, residente em neurologia da Universidade de Alberta, destacou que existe uma lacuna entre o “ambiente artificial” em que as questões médicas são respondidas e a área médica. o actual A prática clínica pode ser muito extensa.

Embora essas comparações diretas representem um grande avanço, também é importante lembrar quão grande é a lacuna existente entre o ambiente não natural da resposta às perguntas médicas e o ambiente clínico real. Escusado será dizer que existem riscos únicos que não podem ser captados por estes indicadores.

-Liam McCoy, MD (@LiamGMcCoy) 18 de abril de 2024

A cientista pesquisadora da Hugface, Clementine Fourier, coautora desta postagem no blog, concordou.

“Essas tabelas de classificação devem ser usadas apenas como uma primeira aproximação. [generative AI model] Explorar casos de uso específicos sempre requer estágios mais profundos de testes para examinar as limitações do modelo e sua relevância para situações do mundo real”, disse Fourier em um post no X. [models] Não deve ser utilizado isoladamente pelos pacientes, mas deve ser treinado para ser uma ferramenta de apoio aos médicos. ”

Isto é uma reminiscência da nossa experiência há alguns anos, quando tentámos introduzir uma ferramenta de rastreio de IA para retinopatia diabética no sistema de saúde tailandês.

Conforme relatado por Devin em 2020, o Google desenvolveu um sistema de aprendizagem profunda que examina imagens dos olhos em busca de evidências de retinopatia, uma das principais causas de perda de visão. No entanto, apesar da sua elevada precisão teórica, esta ferramenta revelou-se impraticável em testes no mundo real, com resultados inconsistentes e uma falta geral de alinhamento com a prática de campo. Ambos os enfermeiros ficaram incomodados.

Dos 139 dispositivos médicos relacionados com IA aprovados até agora pela Food and Drug Administration dos EUA, nenhum utiliza IA generativa. Testar como o desempenho das ferramentas de IA geradas em laboratório se traduz em hospitais e clínicas ambulatoriais é extremamente difícil. Além disso, e talvez mais importante, teste a tendência dos resultados ao longo do tempo.

Isso não quer dizer que o Open Medical-LLM não seja útil ou benéfico. A tabela de classificação de resultados serve pelo menos como um lembrete de como você se saiu. incompleto O modelo responde a questões básicas de saúde. Mas o Open Medical-LLM, e nenhuma outra referência nesse sentido, não substitui testes cuidadosamente elaborados no mundo real.







Source link

Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
Francisco
  • Website

Related Posts

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

July 30, 2024

Airtable adquire startup de integração de talentos de IA Dopt

July 30, 2024

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

July 30, 2024
Add A Comment
Leave A Reply Cancel Reply

Editors Picks

As ações da Microsoft caem mais de 6% após queda nos lucros devido à última decepção com IA

July 30, 2024

Airtable adquire startup de integração de talentos de IA Dopt

July 30, 2024

Os avatares de IA poderão em breve participar de reuniões em nosso nome, mas certamente parece uma ladeira escorregadia em direção a um futuro de IA que nenhum de nós deseja.

July 30, 2024

Microsoft pede novas leis contra golpes deepfake e imagens de abuso sexual de IA

July 30, 2024
Top Reviews
MatoSinhos24h
Facebook X (Twitter) Instagram Pinterest Vimeo YouTube
  • Home
  • About Matosinhos24h.com
  • Advertise with Us
  • Contact us
  • DMCA Policy
  • Policy
  • Terms of Use
© 2025 matosinhos24h. Designed by matosinhos24h.

Type above and press Enter to search. Press Esc to cancel.