Quando falamos em inteligência artificial e computação de alto desempenho (HPC), computadores precisam lidar com quantidades massivas de dados que podem fazer com que a memória do hardware — como placas de vídeo e aceleradores — não seja suficiente.
Pensando nisso, uma startup chamada Panmnesia desenvolveu uma nova técnica que permite que placas de vídeo usem a memória do sistema através do padrão Compute Express Link (CXL). Com isso, a placa de vídeo pode usar a DRAM ou até mesmo um SSD como uma extensão da sua própria memória, garantindo um maior desempenho.
O CXL é um protocolo que funciona através do PCI Express (PCIe), mas ele precisa ser suportado por tudo circuito integrado e seu subsistema. Isso significa que adicioná-lo a um computador não é tão simples quanto simplesmente integrar um controlador CXL, uma vez que não há mecanismos que suportem pontos de DRAM ou SSD em GPUs.
Outro problema é que o cache dos processadores gráficos e os subsistemas de memória não reconhecem expansões que não sejam sua própria memória virtual unificada, que não apresenta o desempenho necessário para IA ou HPC.
À luz desses problemas, a Panmnesia desenvolveu o “CXL GPU Image”, um sistema composto por várias camadas de hardware que suportam todas as principais versões do protocolo CXL, integrando-as em um controlador unificado que consegue acessar memória externa por meio de PCI Express.
Uma das principais vantagens dessa tecnologia é a latência mínima, medida em algumas dezenas de nanosegundos, sendo ainda mais rápida que as velocidades convencionais de um SSD. Em testes de execução do kernel gráfico, a tecnologia mostrou tempos de execução até 3,22 vezes mais rápidos que a memória virtual unificada da GPU.
Com o CXL, é esperado que haja um importante aumento de desempenho no processamento de inteligência artificial e aplicações de HPC, como pesquisas científicas e big data. No entanto, ainda são necessárias avaliações quanto à sua eficiência e viabilidade.
Veja mais!