**El 3 de junio, la aplicación Titanium Media supo exclusivamente de Huawei que Huawei lanzará un producto modelo a gran escala multimodal de 100 mil millones de niveles llamado "Pangu Chat" que coincide directamente con ChatGPT. **
**Se espera que Huawei Pangu Chat se lance y se pruebe internamente en la Huawei Cloud Developer Conference (HDC.Cloud 2023) que se llevará a cabo el 7 de julio de este año. El producto es principalmente para clientes gubernamentales y empresariales de To B/G. **
Esto significa que en la carrera armamentista nacional de modelos a gran escala, después de Ali y Baidu, otro gigante tecnológico importante ha entrado en juego. Según las capacidades técnicas de Huawei, se espera que Pangu Chat se convierta en el producto ChatGPT con las capacidades técnicas más sólidas de China, y las empresas de la cadena de la industria ecológica de Huawei también se beneficiarán de ello.
**Se informa que **Pangu Large Model se estableció con éxito en Huawei Cloud en noviembre de 2020. Para el posicionamiento del modelo grande de Pangu, el equipo interno de Huawei ha establecido tres principios de diseño clave: primero, el modelo debe ser lo suficientemente grande como para absorber cantidades masivas de datos; la capacidad de generalización se puede aplicar verdaderamente a escenarios de trabajo en todos los ámbitos de la vida. .
En abril de 2021, el modelo grande de Pangu se lanzó oficialmente al público. Entre ellos, el modelo grande Pangu NLP es el primer modelo grande chino de preentrenamiento con 100 mil millones de parámetros, y el modelo grande CV ha alcanzado los 3 mil millones de parámetros por primera vez. En abril de 2022, Huawei Pangu se actualizó a 2.0, lanzó un plan de desarrollo jerárquico (LO, L1, L2) y construyó un modelo Pangu de grado industrial.
De acuerdo con la información de presentación PPT de los ejecutivos de Huawei Cloud, en la actualidad, la capa básica del "modelo grande AI de la serie Pangu" de Huawei incluye principalmente el modelo grande NLP, el modelo grande CV y el modelo grande de computación científica, etc., y la capa superior es Modelo grande de la industria de Huawei desarrollado con socios. .
Tian Qi, científico jefe en el campo de la inteligencia artificial en Huawei Cloud, dijo en abril de este año que en 2022, Huawei acaba de entregar un modelo grande de 100 mil millones de parámetros en árabe, que cubre áreas como la recuperación inteligente de documentos, ERP inteligente, y modelos a gran escala en lenguaje pequeño cubiertos por el modelo a gran escala Pangu NLP. En términos de aplicación, el modelo Pangu se puede aplicar en muchos campos, como el servicio al cliente inteligente, la traducción automática, el reconocimiento de voz, etc., brindando soporte técnico de IA.
El año pasado, Huawei aplicó el modelo grande Pangu en el campo de la industria vertical. Un ejemplo es que, basándose en el modelo grande Pangu AI, Huawei construyó el primer "centro de entrenamiento de inteligencia artificial basado en un modelo grande" en el campo de las minas para realizar el desarrollo "industrializado" de aplicaciones Al, que no solo reduce costos - 80 % más que la verificación manual, el costo por tonelada se reduce en 8 yuanes (la capacidad de producción anual es de 2,6 millones de toneladas) y el beneficio aumenta: la presión antichoque es un 80% más baja que la de la verificación manual, y la eficiencia se mejora: la eficiencia de los clientes inteligentes aumenta en un 30%.
En comparación con otros fabricantes, la ventaja de Huawei puede residir en su cadena industrial completa y sus sólidas capacidades de implementación de potencia informática. Según la divulgación anterior de Zheshang Securities, cuando ** estaba entrenando el modelo grande Pangu con 100 mil millones de parámetros, el equipo de Huawei usó más de 2000 chips Shengteng 910 durante más de 2 meses de capacidades de entrenamiento de datos. Según Huawei internamente, se utilizan más de 4000 tarjetas GPU/TPU para el entrenamiento de modelos a gran escala cada año, y el costo de la potencia informática de los modelos a gran escala en tres años asciende a 960 millones de yuanes. **
Según el informe de investigación publicado por Soochow Securities el 27 de marzo, la ventaja del modelo grande Pangu de Huawei radica en su reserva de talento y poder de cómputo controlable independiente, y se espera que se convierta en el modelo grande líder en China. Se espera que marque el comienzo de un desarrollo acelerado, que incluye Tuowei Information, Sichuan Changhong, Kylin Software (software de China), Tongxin Software (tecnología ArcherMind), Kylin Principal y otras empresas ecológicas de Huawei. Guosheng Securities cree que Huawei Pangu es el primer modelo multimodal a gran escala de 100 mil millones de niveles, que se espera que potencie a todas las industrias.
Según los datos publicados por Huawei, los parámetros del modelo grande Pangu-Σ de Huawei son como máximo 1,085 billones, que se desarrolla en base al marco MindSpore de desarrollo propio de Huawei. ** En general, el modelo grande PanGu-Σ puede estar cerca del nivel de GPT-3.5 en términos de diálogo. **
Vale la pena señalar que debido a que el modelo Pangu tiene parámetros muy grandes, el costo de capacitación es relativamente alto. Aunque el modelo Pangu tiene una alta precisión y calidad en el procesamiento del idioma chino, todavía tiene ciertas limitaciones en la comprensión semántica, especialmente al tratar con estructuras lingüísticas complejas y razonamiento semántico. Al mismo tiempo, el modelo grande de Pangu Chat también enfrentará una feroz competencia en la industria y necesita optimizar y mejorar continuamente el rendimiento y la calidad del modelo para mantener su posición de liderazgo en el mercado. (Este artículo es el primer lanzamiento de la aplicación Titanium Media, autor|Lin Zhijia)
Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
La versión de Huawei de ChatGPT se lanzará a principios de julio, llamada "Pangu Chat"
Fuente: Medios de titanio
Autor: Lin Zhijia
**El 3 de junio, la aplicación Titanium Media supo exclusivamente de Huawei que Huawei lanzará un producto modelo a gran escala multimodal de 100 mil millones de niveles llamado "Pangu Chat" que coincide directamente con ChatGPT. **
**Se espera que Huawei Pangu Chat se lance y se pruebe internamente en la Huawei Cloud Developer Conference (HDC.Cloud 2023) que se llevará a cabo el 7 de julio de este año. El producto es principalmente para clientes gubernamentales y empresariales de To B/G. **
Esto significa que en la carrera armamentista nacional de modelos a gran escala, después de Ali y Baidu, otro gigante tecnológico importante ha entrado en juego. Según las capacidades técnicas de Huawei, se espera que Pangu Chat se convierta en el producto ChatGPT con las capacidades técnicas más sólidas de China, y las empresas de la cadena de la industria ecológica de Huawei también se beneficiarán de ello.
**Se informa que **Pangu Large Model se estableció con éxito en Huawei Cloud en noviembre de 2020. Para el posicionamiento del modelo grande de Pangu, el equipo interno de Huawei ha establecido tres principios de diseño clave: primero, el modelo debe ser lo suficientemente grande como para absorber cantidades masivas de datos; la capacidad de generalización se puede aplicar verdaderamente a escenarios de trabajo en todos los ámbitos de la vida. .
En abril de 2021, el modelo grande de Pangu se lanzó oficialmente al público. Entre ellos, el modelo grande Pangu NLP es el primer modelo grande chino de preentrenamiento con 100 mil millones de parámetros, y el modelo grande CV ha alcanzado los 3 mil millones de parámetros por primera vez. En abril de 2022, Huawei Pangu se actualizó a 2.0, lanzó un plan de desarrollo jerárquico (LO, L1, L2) y construyó un modelo Pangu de grado industrial.
De acuerdo con la información de presentación PPT de los ejecutivos de Huawei Cloud, en la actualidad, la capa básica del "modelo grande AI de la serie Pangu" de Huawei incluye principalmente el modelo grande NLP, el modelo grande CV y el modelo grande de computación científica, etc., y la capa superior es Modelo grande de la industria de Huawei desarrollado con socios. .
Tian Qi, científico jefe en el campo de la inteligencia artificial en Huawei Cloud, dijo en abril de este año que en 2022, Huawei acaba de entregar un modelo grande de 100 mil millones de parámetros en árabe, que cubre áreas como la recuperación inteligente de documentos, ERP inteligente, y modelos a gran escala en lenguaje pequeño cubiertos por el modelo a gran escala Pangu NLP. En términos de aplicación, el modelo Pangu se puede aplicar en muchos campos, como el servicio al cliente inteligente, la traducción automática, el reconocimiento de voz, etc., brindando soporte técnico de IA.
El año pasado, Huawei aplicó el modelo grande Pangu en el campo de la industria vertical. Un ejemplo es que, basándose en el modelo grande Pangu AI, Huawei construyó el primer "centro de entrenamiento de inteligencia artificial basado en un modelo grande" en el campo de las minas para realizar el desarrollo "industrializado" de aplicaciones Al, que no solo reduce costos - 80 % más que la verificación manual, el costo por tonelada se reduce en 8 yuanes (la capacidad de producción anual es de 2,6 millones de toneladas) y el beneficio aumenta: la presión antichoque es un 80% más baja que la de la verificación manual, y la eficiencia se mejora: la eficiencia de los clientes inteligentes aumenta en un 30%.
En comparación con otros fabricantes, la ventaja de Huawei puede residir en su cadena industrial completa y sus sólidas capacidades de implementación de potencia informática. Según la divulgación anterior de Zheshang Securities, cuando ** estaba entrenando el modelo grande Pangu con 100 mil millones de parámetros, el equipo de Huawei usó más de 2000 chips Shengteng 910 durante más de 2 meses de capacidades de entrenamiento de datos. Según Huawei internamente, se utilizan más de 4000 tarjetas GPU/TPU para el entrenamiento de modelos a gran escala cada año, y el costo de la potencia informática de los modelos a gran escala en tres años asciende a 960 millones de yuanes. **
Según el informe de investigación publicado por Soochow Securities el 27 de marzo, la ventaja del modelo grande Pangu de Huawei radica en su reserva de talento y poder de cómputo controlable independiente, y se espera que se convierta en el modelo grande líder en China. Se espera que marque el comienzo de un desarrollo acelerado, que incluye Tuowei Information, Sichuan Changhong, Kylin Software (software de China), Tongxin Software (tecnología ArcherMind), Kylin Principal y otras empresas ecológicas de Huawei. Guosheng Securities cree que Huawei Pangu es el primer modelo multimodal a gran escala de 100 mil millones de niveles, que se espera que potencie a todas las industrias.
Según los datos publicados por Huawei, los parámetros del modelo grande Pangu-Σ de Huawei son como máximo 1,085 billones, que se desarrolla en base al marco MindSpore de desarrollo propio de Huawei. ** En general, el modelo grande PanGu-Σ puede estar cerca del nivel de GPT-3.5 en términos de diálogo. **
Vale la pena señalar que debido a que el modelo Pangu tiene parámetros muy grandes, el costo de capacitación es relativamente alto. Aunque el modelo Pangu tiene una alta precisión y calidad en el procesamiento del idioma chino, todavía tiene ciertas limitaciones en la comprensión semántica, especialmente al tratar con estructuras lingüísticas complejas y razonamiento semántico. Al mismo tiempo, el modelo grande de Pangu Chat también enfrentará una feroz competencia en la industria y necesita optimizar y mejorar continuamente el rendimiento y la calidad del modelo para mantener su posición de liderazgo en el mercado. (Este artículo es el primer lanzamiento de la aplicación Titanium Media, autor|Lin Zhijia)