跳到主要内容

C 语言中的字符串映射 – 教程

信息

这是 Kotlin 和 C 映射系列教程的最后一部分。在继续之前,请确保已完成之前的步骤。

First step映射 C 中的基本数据类型
Second step映射 C 中的结构体和联合体类型
Third step映射函数指针
Fourth step映射 C 中的字符串

警告

C 库导入是 Experimental (实验性) 的。所有由 cinterop 工具从 C 库生成的 Kotlin 声明都应该带有 @ExperimentalForeignApi 注解。

Kotlin/Native 附带的 Native 平台库(例如 Foundation、UIKit 和 POSIX)仅对某些 API 需要选择加入(opt-in)。

在本系列的最后一部分,让我们看看如何在 Kotlin/Native 中处理 C 字符串。

在本教程中,你将学习如何:

使用 C 字符串

C 没有专用的字符串类型。方法签名或文档可以帮助你识别给定的 char * 在特定上下文中是否表示 C 字符串。

C 语言中的字符串以 null 结尾,因此在字节序列的末尾添加一个尾随零字符 \0 以标记字符串的结尾。通常,使用 UTF-8 编码字符串。UTF-8 编码使用可变宽度字符,并且向后兼容 ASCII。Kotlin/Native 默认使用 UTF-8 字符编码。

为了理解字符串如何在 Kotlin 和 C 之间映射,首先创建库头文件。在 本系列的第一部分 中,你已经创建了一个包含必要文件的 C 库。对于此步骤:

  1. 使用以下处理 C 字符串的函数声明更新你的 lib.h 文件:

    #ifndef LIB2_H_INCLUDED
    #define LIB2_H_INCLUDED

    void pass_string(char* str);
    char* return_string();
    int copy_string(char* str, int size);

    #endif

    此示例显示了在 C 语言中传递或接收字符串的常用方法。谨慎处理 return_string() 函数的返回值。确保使用正确的 free() 函数来释放返回的 char*

  2. --- 分隔符之后更新 interop.def 文件中的声明:

    ---

    void pass_string(char* str) {
    }

    char* return_string() {
    return "C string";
    }

    int copy_string(char* str, int size) {
    *str++ = 'C';
    *str++ = ' ';
    *str++ = 'K';
    *str++ = '/';
    *str++ = 'N';
    *str++ = 0;
    return 0;
    }

interop.def 文件提供了编译、运行或在 IDE 中打开应用程序所需的一切。

检查为 C 库生成的 Kotlin API

让我们看看 C 字符串声明如何映射到 Kotlin/Native 中:

  1. src/nativeMain/kotlin 中,使用 上一个教程 中的以下内容更新你的 hello.kt 文件:

    import interop.*
    import kotlinx.cinterop.ExperimentalForeignApi

    @OptIn(ExperimentalForeignApi::class)
    fun main() {
    println("Hello Kotlin/Native!")

    pass_string(/*fix me*/)
    val useMe = return_string()
    val useMe2 = copy_string(/*fix me*/)
    }
  2. 使用 IntelliJ IDEA 的 转到声明 命令 (Cmd + B/Ctrl + B) 导航到以下为 C 函数生成的 API:

    fun pass_string(str: kotlinx.cinterop.CValuesRef<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>?)
    fun return_string(): kotlinx.cinterop.CPointer<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>?
    fun copy_string(str: kotlinx.cinterop.CValuesRef<kotlinx.cinterop.ByteVarOf<kotlin.Byte> /* from: kotlinx.cinterop.ByteVar */>?, size: kotlin.Int): kotlin.Int

这些声明很简单。在 Kotlin 中,C char * 指针被映射到参数的 str: CValuesRef<ByteVarOf>? 和返回类型的 CPointer<ByteVarOf>?。Kotlin 将 char 类型表示为 kotlin.Byte,因为它通常是一个 8 位有符号值。

在生成的 Kotlin 声明中,str 被定义为 CValuesRef<ByteVarOf<Byte>>?。由于此类型是可空的,因此你可以传递 null 作为参数值。

将 Kotlin 字符串传递给 C

让我们尝试从 Kotlin 中使用 API。首先调用 pass_string() 函数:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.cstr

@OptIn(ExperimentalForeignApi::class)
fun passStringToC() {
val str = "This is a Kotlin string"
pass_string(str.cstr)
}

由于 String.cstr 扩展属性,将 Kotlin 字符串传递给 C 非常简单。对于涉及 UTF-16 字符的情况,还有 String.wcstr 属性。

在 Kotlin 中读取 C 字符串

现在从 return_string() 函数中获取返回的 char *,并将其转换为 Kotlin 字符串:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.toKString

@OptIn(ExperimentalForeignApi::class)
fun passStringToC() {
val stringFromC = return_string()?.toKString()

println("Returned from C: $stringFromC")
}

在这里,.toKString() 扩展函数将从 return_string() 函数返回的 C 字符串转换为 Kotlin 字符串。

Kotlin 提供了几个扩展函数,用于将 C char * 字符串转换为 Kotlin 字符串,具体取决于编码:

fun CPointer<ByteVarOf<Byte>>.toKString(): String // 用于 UTF-8 字符串的标准函数
fun CPointer<ByteVarOf<Byte>>.toKStringFromUtf8(): String // 显式转换 UTF-8 字符串
fun CPointer<ShortVarOf<Short>>.toKStringFromUtf16(): String // 转换 UTF-16 编码的字符串
fun CPointer<IntVarOf<Int>>.toKStringFromUtf32(): String // 转换 UTF-32 编码的字符串

将 C 字符串字节从 Kotlin 接收

这次,使用 copy_string() C 函数将 C 字符串写入给定的缓冲区。它接受两个参数:指向应写入字符串的内存位置的指针和允许的缓冲区大小。

该函数还应该返回一些内容以指示它是否成功或失败。假设 0 表示成功,并且提供的缓冲区足够大:

import interop.*
import kotlinx.cinterop.ExperimentalForeignApi
import kotlinx.cinterop.addressOf
import kotlinx.cinterop.usePinned

@OptIn(ExperimentalForeignApi::class)
fun sendString() {
val buf = ByteArray(255)
buf.usePinned { pinned `->`
if (copy_string(pinned.addressOf(0), buf.size - 1) != 0) {
throw Error("Failed to read string from C")
}
}

val copiedStringFromC = buf.decodeToString()
println("Message from C: $copiedStringFromC")
}

在这里,首先将 Native 指针传递给 C 函数。.usePinned 扩展函数暂时固定字节数组的 Native 内存地址。C 函数用数据填充字节数组。另一个扩展函数 ByteArray.decodeToString() 假设 UTF-8 编码,将字节数组转换为 Kotlin 字符串。

更新 Kotlin 代码

现在你已经学会了如何在 Kotlin 代码中使用 C 声明,请尝试在你的项目中使用它们。最终 hello.kt 文件中的代码可能如下所示:

import interop.*
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
fun main() {
println("Hello Kotlin/Native!")

val str = "This is a Kotlin string"
pass_string(str.cstr)

val useMe = return_string()?.toKString() ?: error("null pointer returned")
println(useMe)

val copyFromC = ByteArray(255).usePinned { pinned `->`
val useMe2 = copy_string(pinned.addressOf(0), pinned.get().size - 1)
if (useMe2 != 0) throw Error("Failed to read a string from C")
pinned.get().decodeToString()
}

println(copyFromC)
}

要验证一切是否按预期工作,请在你的 IDE 中 运行 runDebugExecutableNative Gradle 任务,或者使用以下命令来运行代码:

./gradlew runDebugExecutableNative

接下来是什么

与 C 的互操作性 文档中了解更多信息,该文档涵盖了更高级的场景。