Namespaces
Variants

mbrtoc8

From cppreference.net
Definido en el encabezado <uchar.h>
size_t mbrtoc8 ( char8_t * restrict pc8, const char * restrict s, size_t n,
mbstate_t * restrict ps ) ;
(desde C23)

Convierte un carácter multibyte estrecho a codificación UTF-8.

Si s no es un puntero nulo, inspecciona como máximo n bytes de la cadena de caracteres multibyte, comenzando por el byte apuntado por s para determinar el número de bytes necesarios para completar el siguiente carácter multibyte (incluyendo cualquier secuencia de cambio). Si la función determina que el siguiente carácter multibyte en s está completo y es válido, lo convierte a UTF-8 y almacena la primera unidad de código UTF-8 en * pc8 (si pc8 no es nulo).

Si la codificación UTF-8 del carácter multibyte en * s consiste en más de una unidad de código UTF-8, entonces después de la primera llamada a esta función, * ps se actualiza de manera que la siguiente llamada a mbrtoc8 escribirá las unidades de código UTF-8 adicionales, sin considerar * s .

Si s es un puntero nulo, los valores de n y pc8 se ignoran y la llamada es equivalente a mbrtoc8 ( nullptr, "" , 1 , ps ) .

Si la unidad de código UTF-8 producida es u8 ' \0 ' , el estado de conversión * ps representa el estado de desplazamiento inicial.

La codificación multibyte utilizada por esta función está especificada por la configuración regional de C actualmente activa.

Contenidos

Parámetros

pc8 - puntero a la ubicación donde se escribirán las unidades de código UTF-8 resultantes
s - puntero a la cadena de caracteres multibyte utilizada como entrada
n - límite en el número de bytes en s que pueden examinarse
ps - puntero al objeto de estado de conversión utilizado al interpretar la cadena multibyte

Valor de retorno

La primera de las siguientes que aplique:

  • 0 si el carácter convertido desde s (y almacenado en * pc8 si no es nulo) era el carácter nulo.
  • El número de bytes [ 1 , n ] del carácter multibyte convertido exitosamente desde s .
  • ( size_t ) - 3 si la siguiente unidad de código UTF-8 de un carácter cuya codificación consiste en múltiples unidades de código ha sido escrita ahora en * pc8 . No se procesan bytes de la entrada en este caso.
  • ( size_t ) - 2 si los siguientes n bytes constituyen un carácter multibyte incompleto, pero hasta ahora válido. No se escribe nada en * pc8 .
  • ( size_t ) - 1 si ocurre un error de codificación. No se escribe nada en * pc8 , el valor EILSEQ se almacena en errno y el valor de * ps no está especificado.

Ejemplo

Referencias

  • Estándar C23 (ISO/IEC 9899:2024):
  • 7.30.1.1 La función mbrtoc8

Véase también

(C23)
convierte cadena UTF-8 a codificación multibyte estrecha
(función)
C++ documentation para mbrtoc8