最新公告
  • 欢迎您光临吆喝资源网,本站提供站长亲测的网站源码下载,打造专业的源码网!立即加入我们
  • 用PHP的FFI调用cjieba

    推荐:《PHP视频教程》

    phpjieba_ffi

    使用PHP 7.4的 FFI 测试直接调用cjieba分词的动态库

    选用CJieba的原因是FFI使用的是C的调用约定,如果用Cpp,还得自己包装一下,然后extern C,让编译器生成标准C的动态库。

    碰到的问题

    段错误

    C变量没有初始化

    直接调用了C的函数,没有通过FFI 初始化后的的C对象调用

    非空判断 需要使用 FFI::isNull($x)

    指针形式的数组 不能用foreach

    指针形式数组的循环

    查看C代码发现Cut部分如下:

    CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
      cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
      vector<string> words;
      string s(sentence, len);
      x->Cut(s, words);
      
      CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
      size_t offset = 0;
      for (size_t i = 0; i < words.size(); i++) {
        res[i].word = sentence + offset;
        res[i].len = words[i].size();
        offset += res[i].len;
      }
      if (offset != len) {
        free(res);
        return NULL;
      }
      res[words.size()].word = NULL;
      res[words.size()].len = 0;
      return res;
    }

    返回的是一个结构体指针,在C语言里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操作来遍历,在FFI里面呢?

    对于这个数组,我一开始用foreach 循环,直接报段错误了,后来和C一样,直接用指针++,发现是可行的,这里给FFI点赞,居然也可以直接操作C指针。

    分词结果获取

    如上面的代码,对于单个分词CJiebaWord,也不是保存的分词,而是sentence + offset,就是说第一个分词结果肯定是原始字符串。

    在C的demo里是printf格式化(. 表示字段宽度和对齐),但是PHP里没有类似的方法,需要截取字符串substr($x->word, 0, $x->len)

      for (x = words; x->word; x++) {
        printf("%*.*s/n", x->len, x->len, x->word);
      }

    用法示例

    编译动态库

    make libjieba.so

    运行

    time php demo.php

    运行c demo

    make demo
    time ./demo

    结果

    PHP
    load: 0.00025701522827148
    real    1m59.619s
    user    1m56.093s
    sys     0m3.517s
    C
    real    1m54.738s
    user    1m50.382s
    sys     0m4.323s
    CPU 占用 基本都是 12%

    可以发现使用FFI,PHP的速度基本和C差不多,如有CPU占用大的业务,可以尝试使用其它语言(C/C++,golang,Rust等)编写然后导出标准C的动态库。

    FFI的用途

    在没有FFI之前,需要系统调用或者sdk方式调用的地方,PHP就需要开发扩展,但是开发扩展不仅需要理解C语言,还得了解PHP内核,比较困难。 现在就方便多了,直接使用FFI调用动态库即可。

    扩展 宏展开

    比如海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

    原文地址:https://github.com/dwdcth/phpjieba_ffi

    以上就是用PHP的FFI调用cjieba的详细内容,更多请关注吆喝资源网其它相关文章!

    本文转自PHP中文网,吆喝网(http://yaoohe.com)搜集整理,如有疑问请联系本站客服!

    1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
    2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
    3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
    4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
    5. 如有链接无法下载、失效或广告,请联系管理员处理!
    6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
    7. 如遇到加密压缩包,默认解压密码为"yaoohe.com",如遇到无法解压的请联系管理员!
    8. 特别声明:本站源码除标明“已测试”外,其它都未测试,有BUG概本站概不负责。
    吆喝资源网 » 用PHP的FFI调用cjieba

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    吆喝资源网
    一个高级程序员模板开发平台

    发表评论

    • 1116会员总数(位)
    • 9344资源总数(个)
    • 333本周发布(个)
    • 5 今日发布(个)
    • 239稳定运行(天)

    专业的网站源码网,提供精品php网站源码下载,小程序源码下载等!!

    小程序源码 了解详情
    升级SVIP尊享更多特权立即升级