dc.contributor.advisor | Denise Maria Zezell | pt_BR |
dc.date | 2023 | pt_BR |
dc.date.accessioned | 2023-07-28T17:42:15Z | |
dc.date.available | 2023-07-28T17:42:15Z | |
dc.identifier.uri | http://repositorio.ipen.br/handle/123456789/34178 | |
dc.description.abstract | Breast cancer is the most incident cancer worldwide. The evaluation of molecular subtypes and their biomarkers plays an essential role in prognosis. The biomarkers used are Estrogen Receptor (ER), Progesterone Receptor (PR), Human Epidermal growth factor Receptor-type 2 (HER2), and Ki67. Based on these, subtypes are classified as Luminal A (LA), Luminal B (LB), HER2 subtype, and Triple-Negative Breast Cancer (TNBC). The gold standard for this analysis is histology and immunohistochemistry, semi-quantitative techniques that present inter-laboratory and inter-observer variations. The Fourier Transform Infrared micro-spectroscopy (micro-FTIR), which provides hyperspectral images with biochemical information of biological tissues, is applied together with artificial intelligence (AI) for cancer evaluation. In this thesis, twenty samples of two breast cancer cell lines, BT-474 and SK-BR-3, were used to define the optimal number of co-added scans for machine learning (ML) techniques. Linear Discriminant Analysis (LDA), Partial Least Squares Discriminant Analysis (PLS-DA), K-Nearest Neighbors (KNN), Support Vector Machines (SVM), Random Forest (RF), and Extreme Gradient Boosting (XGB) models were used. Sixty hyperspectral images of 320x320 pixels were collected from thirty patients of a human breast biopsies microarray, each containing a breast cancer (CA) and an adjacent tissue (AT) core. Automated methods based on K-Means clustering were developed for data organization and pre-processing to one-dimensional (1D) and two-dimensional (2D) data. The dataset was used to train two new deep learning models for breast cancer subtype evaluation: CaReNet-V1, a 1D Convolutional Neural Network (CNN); and CaReNet-V2, a 2D CNN. All ML models achieved similar performances with the b256_064 (256 background scans and 64 sample scans), b256_128, and b128_128 groups, where the best accuracy of 0.995 was presented by the XGB model. The b256_064 was established as the ideal among the three due to the shortest acquisition time. The K-Means-based method enabled fully automated preprocessing and organization, improving data quality and optimizing CNN training. CaReNet-V1 effectively classified CA and AT (individual spectra test accuracy of 0.89), as well as HER2 and TNBC subtypes (0.83 and 0.86), with greater difficulty for LA and LB (0.74 and 0.68). The model enabled the evaluation of the most contributing wavenumbers to the predictions, providing a direct relationship with the biochemical content of the samples. CaReNet-V2 demonstrated better performance than 1D, with test accuracies above 0.84, and enabled the prediction of ER, PR, and HER2 levels, where borderline values showed lower performance (minimum accuracy of 0.54). The Ki67 percentage regression demonstrated an absolute mean error of 3.6%. On the other hand, its impact evaluation by wavenumber was inferior to 1D. Thus, this study indicates image-based AI techniques using micro-FTIR as potential providers of additional information to pathological reports, also serving as patient biopsy screening techniques. | pt_BR |
dc.description.sponsorship | Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | pt_BR |
dc.format.extent | 126 | pt_BR |
dc.rights | openAccess | pt_BR |
dc.title | Evaluation of breast cancer molecular subtypes using artificial intelligence in micro-FTIR hyperspectral images | pt_BR |
dc.title.alternative | Avaliação de subtipos moleculares de câncer de mama utilizando inteligência artificial em imagens hiperespectrais por micro-FTI | pt_BR |
dc.type | Tese | pt_BR |
ipen.identifier.ipendoc | 29802 | pt_BR |
sigepi.autor.atividade | DEL VALLE, MATHEUS:15209:920:S | pt_BR |
dc.coverage | N | pt_BR |
dc.creator.author | DEL VALLE, MATHEUS | pt_BR |
dc.description.notasgerais | Tese (Doutorado em Tecnologia Nuclear) | pt_BR |
dc.description.notastese | IPEN/T | pt_BR |
dc.description.teseinstituicao | Instituto de Pesquisas Energéticas e Nucleares - IPEN-CNEN/SP | pt_BR |
dc.local | São Paulo | pt_BR |
ipen.autor | DEL VALLE, MATHEUS | pt_BR |
ipen.date.recebimento | 23-07 | |
ipen.meioeletronico | https://www.teses.usp.br/teses/disponiveis/85/85134/tde-10072023-162427/pt-br.php | pt_BR |
ipen.codigoautor | 15209 | pt_BR |
dc.description.sponsorshipID | FAPESP: 05/51689-2; 17/50332-0 | pt_BR |
dc.description.sponsorshipID | CAPES: 001; PROCAD 88881.068505/2014-01 | pt_BR |
dc.description.sponsorshipID | CNPq: INCT-465763/2014-6; PQ-309902/2017-7; 142229/2019-9 | pt_BR |
dc.identifier.doi | 10.11606/T.85.2023.tde-10072023-162427 | pt_BR |
dc.contributor.coadvisor | Emerson Soares Bernardes | pt_BR |
Arquivos | Tamanho | Formato | Visualização |
---|---|---|---|
Não existem arquivos associados a este item. |
A pesquisa no RD utiliza os recursos de busca da maioria das bases de dados. No entanto algumas dicas podem auxiliar para obter um resultado mais pertinente.
✔ É possível efetuar a busca de um autor ou um termo em todo o RD, por meio do Buscar no Repositório , isto é, o termo solicitado será localizado em qualquer campo do RD. No entanto esse tipo de pesquisa não é recomendada a não ser que se deseje um resultado amplo e generalizado.
✔ A pesquisa apresentará melhor resultado selecionando um dos filtros disponíveis em Navegar
✔ Os filtros disponíveis em Navegar tais como: Coleções, Ano de publicação, Títulos, Assuntos, Autores, Revista, Tipo de publicação são autoexplicativos. O filtro, Autores IPEN apresenta uma relação com os autores vinculados ao IPEN; o ID Autor IPEN diz respeito ao número único de identificação de cada autor constante no RD e sob o qual estão agrupados todos os seus trabalhos independente das variáveis do seu nome; Tipo de acesso diz respeito à acessibilidade do documento, isto é , sujeito as leis de direitos autorais, ID RT apresenta a relação dos relatórios técnicos, restritos para consulta das comunidades indicadas.
A opção Busca avançada utiliza os conectores da lógica boleana, é o melhor recurso para combinar chaves de busca e obter documentos relevantes à sua pesquisa, utilize os filtros apresentados na caixa de seleção para refinar o resultado de busca. Pode-se adicionar vários filtros a uma mesma busca.
Exemplo:
Buscar os artigos apresentados em um evento internacional de 2015, sobre loss of coolant, do autor Maprelian.
Autor: Maprelian
Título: loss of coolant
Tipo de publicação: Texto completo de evento
Ano de publicação: 2015
✔ Para indexação dos documentos é utilizado o Thesaurus do INIS, especializado na área nuclear e utilizado em todos os países membros da International Atomic Energy Agency – IAEA , por esse motivo, utilize os termos de busca de assunto em inglês; isto não exclui a busca livre por palavras, apenas o resultado pode não ser tão relevante ou pertinente.
✔ 95% do RD apresenta o texto completo do documento com livre acesso, para aqueles que apresentam o significa que e o documento está sujeito as leis de direitos autorais, solicita-se nesses casos contatar a Biblioteca do IPEN, [email protected] .
✔ Ao efetuar a busca por um autor o RD apresentará uma relação de todos os trabalhos depositados no RD. No lado direito da tela são apresentados os coautores com o número de trabalhos produzidos em conjunto bem como os assuntos abordados e os respectivos anos de publicação agrupados.
✔ O RD disponibiliza um quadro estatístico de produtividade, onde é possível visualizar o número dos trabalhos agrupados por tipo de coleção, a medida que estão sendo depositados no RD.
✔ Na página inicial nas referências são sinalizados todos os autores IPEN, ao clicar nesse símbolo será aberta uma nova página correspondente à aquele autor – trata-se da página do pesquisador.
✔ Na página do pesquisador, é possível verificar, as variações do nome, a relação de todos os trabalhos com texto completo bem como um quadro resumo numérico; há links para o Currículo Lattes e o Google Acadêmico ( quando esse for informado).
ATENÇÃO!
ESTE TEXTO "AJUDA" ESTÁ SUJEITO A ATUALIZAÇÕES CONSTANTES, A MEDIDA QUE NOVAS FUNCIONALIDADES E RECURSOS DE BUSCA FOREM SENDO DESENVOLVIDOS PELAS EQUIPES DA BIBLIOTECA E DA INFORMÁTICA.
O gerenciamento do Repositório está a cargo da Biblioteca do IPEN. Constam neste RI, até o presente momento 20.950 itens que tanto podem ser artigos de periódicos ou de eventos nacionais e internacionais, dissertações e teses, livros, capítulo de livros e relatórios técnicos. Para participar do RI-IPEN é necessário que pelo menos um dos autores tenha vínculo acadêmico ou funcional com o Instituto. Nesta primeira etapa de funcionamento do RI, a coleta das publicações é realizada periodicamente pela equipe da Biblioteca do IPEN, extraindo os dados das bases internacionais tais como a Web of Science, Scopus, INIS, SciElo além de verificar o Currículo Lattes. O RI-IPEN apresenta também um aspecto inovador no seu funcionamento. Por meio de metadados específicos ele está vinculado ao sistema de gerenciamento das atividades do Plano Diretor anual do IPEN (SIGEPI). Com o objetivo de fornecer dados numéricos para a elaboração dos indicadores da Produção Cientifica Institucional, disponibiliza uma tabela estatística registrando em tempo real a inserção de novos itens. Foi criado um metadado que contém um número único para cada integrante da comunidade científica do IPEN. Esse metadado se transformou em um filtro que ao ser acionado apresenta todos os trabalhos de um determinado autor independente das variáveis na forma de citação do seu nome.
A elaboração do projeto do RI do IPEN foi iniciado em novembro de 2013, colocado em operação interna em julho de 2014 e disponibilizado na Internet em junho de 2015. Utiliza o software livre Dspace, desenvolvido pelo Massachusetts Institute of Technology (MIT). Para descrição dos metadados adota o padrão Dublin Core. É compatível com o Protocolo de Arquivos Abertos (OAI) permitindo interoperabilidade com repositórios de âmbito nacional e internacional.
1. Portaria IPEN-CNEN/SP nº 387, que estabeleceu os princípios que nortearam a criação do RDI, clique aqui.
2. A experiência do Instituto de Pesquisas Energéticas e Nucleares (IPEN-CNEN/SP) na criação de um Repositório Digital Institucional – RDI, clique aqui.
O Repositório Digital do IPEN é um equipamento institucional de acesso aberto, criado com o objetivo de reunir, preservar, disponibilizar e conferir maior visibilidade à Produção Científica publicada pelo Instituto, desde sua criação em 1956.
Operando, inicialmente como uma base de dados referencial o Repositório foi disponibilizado na atual plataforma, em junho de 2015. No Repositório está disponível o acesso ao conteúdo digital de artigos de periódicos, eventos, nacionais e internacionais, livros, capítulos, dissertações, teses e relatórios técnicos.
A elaboração do projeto do RI do IPEN foi iniciado em novembro de 2013, colocado em operação interna em julho de 2014 e disponibilizado na Internet em junho de 2015. Utiliza o software livre Dspace, desenvolvido pelo Massachusetts Institute of Technology (MIT). Para descrição dos metadados adota o padrão Dublin Core. É compatível com o Protocolo de Arquivos Abertos (OAI) permitindo interoperabilidade com repositórios de âmbito nacional e internacional.
O gerenciamento do Repositório está a cargo da Biblioteca do IPEN. Constam neste RI, até o presente momento 20.950 itens que tanto podem ser artigos de periódicos ou de eventos nacionais e internacionais, dissertações e teses, livros, capítulo de livros e relatórios técnicos. Para participar do RI-IPEN é necessário que pelo menos um dos autores tenha vínculo acadêmico ou funcional com o Instituto. Nesta primeira etapa de funcionamento do RI, a coleta das publicações é realizada periodicamente pela equipe da Biblioteca do IPEN, extraindo os dados das bases internacionais tais como a Web of Science, Scopus, INIS, SciElo além de verificar o Currículo Lattes. O RI-IPEN apresenta também um aspecto inovador no seu funcionamento. Por meio de metadados específicos ele está vinculado ao sistema de gerenciamento das atividades do Plano Diretor anual do IPEN (SIGEPI). Com o objetivo de fornecer dados numéricos para a elaboração dos indicadores da Produção Cientifica Institucional, disponibiliza uma tabela estatística registrando em tempo real a inserção de novos itens. Foi criado um metadado que contém um número único para cada integrante da comunidade científica do IPEN. Esse metadado se transformou em um filtro que ao ser acionado apresenta todos os trabalhos de um determinado autor independente das variáveis na forma de citação do seu nome.